Gene Athe_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1894
Symbol
ID	7409007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2002750
End bp	2004000
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	36%
IMG OID	643716266
Product	ABC transporter related
Protein accession	YP_002573755
Protein GI	222529873
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1120] ABC-type cobalamin/Fe3+-siderophores transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTCTTT TTGTTGAGAA CCTTAAATGC GGCTACTCTT ATCCCATTGT TGAGGTAGAC 
GGAAGGCTTA AGTTCGAAGA AGGGAAAGTC TATGGATTTG TTGGACCAAA CGGAAGTGGT 
AAAAGTACAC TGATAAAGGC TTTAGCAGGA CTTGTCAAAA TTTTTGAAGG AAAAATCTAT 
TTTGATAATA TGCAGCTTAG CCAACTTTCT GATATAGAAA GGGCTAAGCA TATCTCGTAT 
ATGCCACAAC ATGTATTTTC AAACTTTCCT TTTACAGTCC TTGATGTTGT TATGATGGGG 
AGATTTCCTT ATGAAAAGAG TAAATTTTTA AACAGCAAAG AAAGTAGAAC AATTGCAGAG 
AAGAAAATAA AACAGGTTGA ACTTTCCAGT AAAAAATTTT CGAGCATATT AAGGATATCA 
GGTGGTGAGA GGCAAAGAAC TTCTTTTGCT CGTGTACTTG CTCAGGATAC TAAAGTTTTA 
CTTTTGGACG AGCCGAACTC AAATTTAGAC ATCTCTCATC AGGAAAAGAT ACTTAGGCTT 
GTAAGAGAAG AAGCGTTTTC TGGGAAGATA GTCATAATGG CAATTCATAA TCTGAAGATG 
GCAGCAAAAG TGTGTGATAG CATCATTATG ATGAAAGATG GCAGAGTTGT GGATATTGGA 
AGACCTGATG AGGTTTTAAC TCAGGAGAAT ATAAGAAAAG TATATGAAGT TGATGCAGTT 
GTTTACAAAA ATCCTTTCGG TATATTTGAC ATAGAGCTTA TCCAGACAGA CGTTCCAAAA 
ACTTTTCATG TACATGTTGT ATCAGGAGGT GGAAGTGCAC AGCTTCTTTA TAAGATGCTA 
ATTGAAATGG GATGCAGGGT GACAACAGGT GTTCTTTCCA CAAACGATAC AGACTTTGAA 
ACAGCTCAAC TTTTTTCCAT CTATACAGTT TTTACAAAAC CTTTTATGCC AATTGGAGAA 
AAAGAGTACA TCGAAAACAT TCAGCTTATC AAGAAAGCAG ACCTGTGTGT GCTGTGCAAC 
ATTCCATTTG GTGTTCAAAA CTTAAAAAAC TTAGAGGCAC TTAAATTTGC TAATCATCTT 
TGTATAATTG AAGAAGAGGA TATTTCAAAA CGTGATTTCA CAGGTGGTTT GGCAACTAAA 
CTTTACAATT GCTTGAGGGA AAAAGCGTTA GTTTTTTCAA GCATTGAGAG CTTGCAAGAT 
TATATCTTAA AAGAGACAAA CGATAAAATG TCAAGGGGTG ATTTAAAATG A

Protein sequence

MPLFVENLKC GYSYPIVEVD GRLKFEEGKV YGFVGPNGSG KSTLIKALAG LVKIFEGKIY 
FDNMQLSQLS DIERAKHISY MPQHVFSNFP FTVLDVVMMG RFPYEKSKFL NSKESRTIAE 
KKIKQVELSS KKFSSILRIS GGERQRTSFA RVLAQDTKVL LLDEPNSNLD ISHQEKILRL 
VREEAFSGKI VIMAIHNLKM AAKVCDSIIM MKDGRVVDIG RPDEVLTQEN IRKVYEVDAV 
VYKNPFGIFD IELIQTDVPK TFHVHVVSGG GSAQLLYKML IEMGCRVTTG VLSTNDTDFE 
TAQLFSIYTV FTKPFMPIGE KEYIENIQLI KKADLCVLCN IPFGVQNLKN LEALKFANHL 
CIIEEEDISK RDFTGGLATK LYNCLREKAL VFSSIESLQD YILKETNDKM SRGDLK