Gene Franean1_5458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5458
Symbol
ID	5673789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6600220
End bp	6601470
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	74%
IMG OID	641244313
Product	ABC transporter related
Protein accession	YP_001509719
Protein GI	158317211
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.665559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGA TCGAGTTCCG CGACGTCACG CTCACCTACG ATGTCCGGCC GATACTCGAC 
AACCTCAGCC TCGTGATCGG GGACGGCGAG TTCCTCGTCC TCGTCGGTCC CTCCGGCAGC 
GGCAAGACGA CGGCGCTGCG GATCGTCGCC GGCCTGCTCG CGCCCACCGC GGGCCAGGTC 
CTCGTCGGCG GCCGGGACGT CACCCGGGTG GCGCCGGCCG ACCGTGACCT CGCGATGGTC 
TTCCAGAGCT ACGCCCTGTA CCCGCACATG ACCGTGCGTC GCAACATGGA GTTCGGCCTG 
AAGCTCGCCG GGGTCGACCG GCGGGAACGC GACAGCAGAG TGGCCGCGGC GGCCGAGACG 
CTCGGCCTGA CCGAGCTCCT CGACCGGCGG CCGCGGGCGC TGTCCGGCGG CCAGCGCCAG 
CGTGTCGCGA TGGGGCGTGC GCTCGTCCGT CAGCCGCGGG CGTTCCTGAT GGACGAGCCG 
CTGTCGAACC TGGACGCCAA GCTGCGGGTG CGGGTCCGCG CGGAGATCGC TCGCATCCAG 
CGCTCGCTGG GCACCACCAC GCTCTACGTG ACCCACGACC AGACCGAGGC GATGACGATG 
GCCGACCGGG TCGCCGTCCT GCACGACGGG CGGCTGCAGC AGGTCGGCAC GCCCGATGAC 
CTGTTCAACC GCCCGGCGAA CGTCTTCGTC GCCGCGTTCA TCGGCAGCCC GCCGGCCAAC 
CTCGTCCCCG GCCGGCTGGT CTCAGAGGAT CATGCCGTCG CGCTGCGGGT CGGCGACCAG 
ACCCTCGTGC TGCCAGTGGA CGTCGCCGCC GGGCTCACCC CGTCGGCCGG CACCGAGGTG 
ATCGTCGGCG TGCGGCCGCA TGACGTCCAG ATCGAGCCGC CGCCGGGACC AGCCCTGATC 
CTCGACGTCG ACGTCGACCT TGTGGAGCGG CTCGGCACCG AGACTCTCGC CCACGGCGAG 
ATGGTGACGG GTGCCCTCAC CGGGAGCGCG GCGCGGGCGG CGATCGCGCT CGCCGCCGGC 
GACGACGAGC TCACCGGCCG GGAGTCCGGC CAGGAGGCCG GTGATGAATC CGGGCGCGCG 
CCCGGCGGCC GTCCGGGGAC ATCCCGTTTC ACCGCCGCGC TGAGCCCGCG GACCGACGTC 
ACCGCCGCCG GGCGGCTCCG GCTGTACGCC GCGGCGGACC GGCTCCACCT GTTCGACGCC 
GATACGGGCG CGACGCTGCG CCCCGCGCCC GCCGCCCTCG CCGCCGCCTG A

Protein sequence

MSTIEFRDVT LTYDVRPILD NLSLVIGDGE FLVLVGPSGS GKTTALRIVA GLLAPTAGQV 
LVGGRDVTRV APADRDLAMV FQSYALYPHM TVRRNMEFGL KLAGVDRRER DSRVAAAAET 
LGLTELLDRR PRALSGGQRQ RVAMGRALVR QPRAFLMDEP LSNLDAKLRV RVRAEIARIQ 
RSLGTTTLYV THDQTEAMTM ADRVAVLHDG RLQQVGTPDD LFNRPANVFV AAFIGSPPAN 
LVPGRLVSED HAVALRVGDQ TLVLPVDVAA GLTPSAGTEV IVGVRPHDVQ IEPPPGPALI 
LDVDVDLVER LGTETLAHGE MVTGALTGSA ARAAIALAAG DDELTGRESG QEAGDESGRA 
PGGRPGTSRF TAALSPRTDV TAAGRLRLYA AADRLHLFDA DTGATLRPAP AALAAA