Gene Athe_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1803
Symbol
ID	7408590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1875744
End bp	1876856
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	41%
IMG OID	643716180
Product	ABC transporter related
Protein accession	YP_002573669
Protein GI	222529787
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000191731
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAGTG TAAGATTAAA AGGTGTTTAC AAGAGATATC CTGGTGGTGT TACAGCTGTT 
TCTGACTTTA ACTTAGATAT TGAGGACAAG GAATTCATAG TTTTGGTTGG ACCATCTGGT 
TGTGGTAAGA CAACAACACT GAGAATGATA GCAGGCCTTG AAGAGGTAAC AGAAGGCGAA 
ATCTACATAG GGGACAAGCT GGTAAACGAC GTCCCACCAA AGGATAGAGA CATTGCAATG 
GTTTTCCAGA ACTATGCTCT GTATCCTCAC ATGACAGTTT TTGAGAACAT GGCATTTGGT 
CTCAAGCTCA GAAAGTTTCC AAAAGATGAG ATAAAAAGAC GTGTACATGA AGCAGCTAAG 
ATTTTGGGAA TTGAGCACCT GCTTGACAGA AAACCAAAGG CTCTGTCCGG TGGTCAGAGA 
CAGAGAGTGG CTTTAGGTCG TGCTATTGTG AGAGAACCAA AGGTATTCCT CATGGATGAG 
CCTCTTTCAA ACTTGGACGC AAAGCTCAGA GTCCAGATGA GAGCAGAGCT ATCCAAACTT 
CACAAGAGAC TTGGAACAAC ATTCATCTAC GTTACACACG ACCAAACAGA AGCTATGACA 
ATGGGTACAA GAATTGTTGT TATGAAAGAT GGATTTATCC AGCAGGTTGA TACACCACAG 
GTTCTGTATG AGCAACCTGC AAATCTGTTT GTTGCAGGTT TCATTGGTTC GCCACAGATG 
AACTTCATTG AATCAAGGAT TGAGCAAAAA GATAAAAACT TATATGTTGT ATTTGGAAAC 
AACGCAATAA AACTCCCAGA AGGAAAGGCA AAGAAAGTTG AAGAGCTCGG CTATGTTGGG 
AAGGAAGTTA TAATGGGTAT TAGACCAGAA GATTTGCACG ATGAAGAGAT ATTCCTGCAG 
ACAGCTCAGG ATGCTGTTGT TGATGCAGAT GTTGATGTTG TTGAGATGCT TGGTTCTGAA 
ACACTTTTAT ATGTTGTTGT TGATGGTCTT AACCTCATTG CGAGAGTTGA TCCAAGGTCA 
AAGGCAAAAA GTGGCGACAG AATTAAACTT GCATTTGACG TTAACAGAAT TCACCTGTTT 
GATAAAGAAA CAGAGAAGGC TATTGTTCAC TAA

Protein sequence

MASVRLKGVY KRYPGGVTAV SDFNLDIEDK EFIVLVGPSG CGKTTTLRMI AGLEEVTEGE 
IYIGDKLVND VPPKDRDIAM VFQNYALYPH MTVFENMAFG LKLRKFPKDE IKRRVHEAAK 
ILGIEHLLDR KPKALSGGQR QRVALGRAIV REPKVFLMDE PLSNLDAKLR VQMRAELSKL 
HKRLGTTFIY VTHDQTEAMT MGTRIVVMKD GFIQQVDTPQ VLYEQPANLF VAGFIGSPQM 
NFIESRIEQK DKNLYVVFGN NAIKLPEGKA KKVEELGYVG KEVIMGIRPE DLHDEEIFLQ 
TAQDAVVDAD VDVVEMLGSE TLLYVVVDGL NLIARVDPRS KAKSGDRIKL AFDVNRIHLF 
DKETEKAIVH