Gene Franean1_6303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6303
Symbol
ID	5675784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7659082
End bp	7660332
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID	641245156
Product	integrase family protein
Protein accession	YP_001510551
Protein GI	158318043
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.66477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGC AGGACCCTCG CGGTGACGAG GACACCCCGG ACGAGTCGAC CGGCAGGAAG 
AAGAAGCAGA ACCGCCGGGC GCAGGGCGAG GGCTCGGTGT ACTGGCGTGA GGACCGTCAG 
CGTTGGGTCA TCGAGATCGA CTACGGAGTG GTGAACGGCC GGCGCAAGCG CGTGCCGCGC 
TACTTCCGGA CGCAGGAAGA GGCGATCGAG GAGCAGCGGA AGGCGCGGCA GAGCAAGGCG 
GACGGGCTGA CCACCCTCGA CCGGCGGTCG CGGTTCGCGG ACTTCCTGAC GTACTGGCTG 
GACGAGATCG TCGACCCGTC TGAACGGGCG GAGTCCACGA AGTCGAACTA CCGCGTCATG 
GTGAACAACC ACATCCGCCC GGCGCTCGGC TCGCGCCGGC TCGTCGAACT GAAGCACGAG 
GATCTTCAGC GGTTCCTGAA CCGCAAGGCG GCGGATGGGT ACAGCACGTC GACCATGCGC 
ACGCTGCGTT CCGTCCTGCG CCAAGCGCTC AACGAAGCGG TCATCACCGA GAAGATCAGT 
CGCAATGTCG CCGAGACGCT GCGGGTCCCG AAAGCGCGGA AACCGAAGCG GAATGTGGCC 
GCGCTGAGCA GGGACGACGG GCTGCGGCTG CTCGCCGAAG CGAAGTCCAC CCGGCATTAC 
GCGCTGTATG TGCTGCTGGC GATGGTCGGT CTACGCCGTG GGGAAGCGCT CGCGTTGCGC 
TGGTCCGACT TCGACGAATC GGCAGGCACG CTGCGGGTGG TACGCCAGGT GACCCGGGTG 
AGCGGCGTGA AGGGGCTGGT CGTCGGCCCG ACGAAGAGTC AGGCCGGAAC ACGCACGCTC 
ACGCTGCCGA CCCGATGCGT CCGGGTGCTC CAGGCACACC GCACCGCCCA GCACGCCCAC 
CGGCAGGCCG CGGGGAAGCG GTGGAAGGAG AACGGGCTGA TCTTCCCGAG TACCGTCGGC 
ACGCACATGG AGCCGCGCGG GCTGAACACC CACCTGTCCA AGCTGTGCCA GCGTGCCGGG 
CTGCCGCACC TCGGCCCGCA CGCGCTGCGG CACACCGCGG CCACGATGGC CTACGCGCTC 
GGTGTCGACT GGAAGCAGAT ACAGCAGATG CTCGGCCACA CGATGCTGTC GACCACGATG 
GACATCTACG TGGACCTGGT CGACAGCGTC CACCGCGACG CGGCGTCCAA ACTCGACGCG 
TGGTTCGACG AACCTGATGA AGACGGTGGG CTCAGCCCAG CACAGCGGTA G

Protein sequence

MTGQDPRGDE DTPDESTGRK KKQNRRAQGE GSVYWREDRQ RWVIEIDYGV VNGRRKRVPR 
YFRTQEEAIE EQRKARQSKA DGLTTLDRRS RFADFLTYWL DEIVDPSERA ESTKSNYRVM 
VNNHIRPALG SRRLVELKHE DLQRFLNRKA ADGYSTSTMR TLRSVLRQAL NEAVITEKIS 
RNVAETLRVP KARKPKRNVA ALSRDDGLRL LAEAKSTRHY ALYVLLAMVG LRRGEALALR 
WSDFDESAGT LRVVRQVTRV SGVKGLVVGP TKSQAGTRTL TLPTRCVRVL QAHRTAQHAH 
RQAAGKRWKE NGLIFPSTVG THMEPRGLNT HLSKLCQRAG LPHLGPHALR HTAATMAYAL 
GVDWKQIQQM LGHTMLSTTM DIYVDLVDSV HRDAASKLDA WFDEPDEDGG LSPAQR