Gene Franean1_4614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4614
Symbol
ID	5672959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5499574
End bp	5500770
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	71%
IMG OID	641243475
Product	ABC transporter related
Protein accession	YP_001508891
Protein GI	158316383
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA TCGTGCTCGA CCACGTCACC AAGCGGTTCC CGGACGGCCG GCTCGCGGTG 
GACGACGCCA GCCTCTCCAT CGCGGACGGC GAGTTCGTCA TCCTCGTCGG CCCGTCCGGG 
TGCGGGAAGT CGACCACCCT GAACATGATC GCCGGCCTGG AGGACATCTC CTCCGGCGAG 
CTGCGGATCG GCGGCAAGGT GGTCAACGAC CTGGCGCCGA AGGACCGCGA CATCGCCATG 
GTGTTCCAGA GCTACGCCCT GTACCCGCAC ATGTCGGTCC GGAAGAACAT GGGCTTCGCC 
CTGTCGCTGG CGAAACGACC GAAGGAGGAG ATCGACCGGT TGGTCGAGGA GGCCGCCCGG 
GTCCTCGACC TCACCGAGCA CCTGGACCGC AAGCCGGCCC AGCTCTCCGG TGGGCAGCGG 
CAGCGGGTCG CGATGGGCCG CGCGATCGTC CGCTCCCCGA AGGCGTTCCT GATGGACGAG 
CCGCTGTCCA ACCTGGACGC CAAGCTGCGG GTGCAGATGC GCACCGAGGT GTCCCGCATC 
CAGAACCGAC TCGGCACGAC CATGGTGTAC GTCACCCACG ACCAGACCGA GGCGATGACG 
CTGGGCGACC GGGTGGCGGT GCTGCGGTCC GGGCGGATCC AGCAGGTCGG CACGCCGACC 
GAGCTGTACG CCCGGCCGGC GACGGTGTTC GTGGCCGGTT TCATCGGCTC ACCCGCGATG 
AACTTCGTGC CGGCGACCCT CGAGGAGGGC GAGCTGCGCA CCCCCCTCGG GACGATCGTC 
CCGGACGAGC GGCAGCGGCG GCTGCTGGAG GGCTGGAACG GGACGGCGGC CGACCGTCGG 
TCGCTGATCG TCGGGGTGCG GCCCGAGCAC TTCGAGGACG CGGCGCTGGA GCCGGCGAAG 
GACCGCCCGG GACTGCGGTT CACGGTCACG GTGGACGTGC TGGAGCGGCT CGGCTCGGAC 
AGCTTCGCCT ACTTCACCCT GGCGGGCGGG CGCGCCCGGA CCGCCGACCT GGAGGAGCTG 
GCCCACGACG CGGGCACGGT CGAGCTGTCC GGCAAGGCGG AACAGGTGGT CGCCCGGCTC 
GACGCGGCCA GCCGGATCCG GGAGGGCGAG AAGGCCGAGC TGTGGCTGGA CGTCCACCAG 
CTGCACCTGT TCGACCCCGA CACCGGCCGC AACCTGGACG CCCCGGCCAC GGCATGA

Protein sequence

MADIVLDHVT KRFPDGRLAV DDASLSIADG EFVILVGPSG CGKSTTLNMI AGLEDISSGE 
LRIGGKVVND LAPKDRDIAM VFQSYALYPH MSVRKNMGFA LSLAKRPKEE IDRLVEEAAR 
VLDLTEHLDR KPAQLSGGQR QRVAMGRAIV RSPKAFLMDE PLSNLDAKLR VQMRTEVSRI 
QNRLGTTMVY VTHDQTEAMT LGDRVAVLRS GRIQQVGTPT ELYARPATVF VAGFIGSPAM 
NFVPATLEEG ELRTPLGTIV PDERQRRLLE GWNGTAADRR SLIVGVRPEH FEDAALEPAK 
DRPGLRFTVT VDVLERLGSD SFAYFTLAGG RARTADLEEL AHDAGTVELS GKAEQVVARL 
DAASRIREGE KAELWLDVHQ LHLFDPDTGR NLDAPATA