Gene Athe_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1916
Symbol
ID	7407329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2021362
End bp	2022339
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	40%
IMG OID	643716288
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002573777
Protein GI	222529895
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00471699
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAGCG TATCAAAAGA ACTTTTTGTA CCAGTTCCGA AAGAAGAGAG GCAGCAAGAG 
ACAATTGTCA GGCCAAGCAT GAGCTACTGG CAGGATGCAT GGAGAAGACT TAAGGCTAAT 
AAAGTAGCAA TGGCATCAAT GTGGACAATA GTGTTTTTTA TTTTGCTTGC CATAATTGGT 
CCAATAGTTA TGCCATACAA ATATGATCAG CAGATTAGAG GGCATGAAGC ACTGCCACCG 
TCACTTACTC ATTTATTTGG AACTGATGAG CTTGGTAGAG ATTTGTTTGT AAGATGCTTG 
TATGGTATGA GAATCTCTCT TTCCATAGGA ATTGTTGCAA CAATTATAAA TATTGTGATT 
GGTGTTTTAT ATGGGGGCAT CTCGGGGTAT ATAGGTGGCA GAGTTGACAA TATAATGATG 
AGAATAGTTG ATATCCTGTA CAGTATACCT TTGATGATTT ACGTAATTCT TCTTTCAGTA 
TCGTTAAAGC CTGCTTTGGA AGCTCTTTTT GATAAGTATT CATTTTTGAG CGGACTTCAG 
ACAGTGGGTG CACCACTTGT TTGTATATAC ATTGCATTGG GACTTACTTA CTGGATTTCG 
ATGGCGAGGA TTGTGCGTGG AGAGATATTA AGCTTAAAAC AGCAAGAATA TGTTACAGCC 
GCAAAAACAA TTGGTGCAAG TGGTTGGAGG ATTTTGCTCA GGCACCTGAT TCCAAACAGC 
ATGGGGTCAA TTATAGTCAC TGCTACGCTG CAGATTCCAA GTGCCATTTT TACTGAGTCT 
TTTTTGAGCT TCATTGGTCT TGGTGTTGAT GCACCTGTTC CATCACTTGG TTCTTTGGCA 
TCAGATGGTG TTAACGGTTT TATATCATAC CCTTATAGGC TATTTTTCCC ATCGCTTTTG 
TTGTGTTTGA TAATACTTGC ATTCAACTTG TTTGGGGATG GGCTCAGAGA TGCACTTGAT 
CCAAGAATGA GAAAGTAA

Protein sequence

MESVSKELFV PVPKEERQQE TIVRPSMSYW QDAWRRLKAN KVAMASMWTI VFFILLAIIG 
PIVMPYKYDQ QIRGHEALPP SLTHLFGTDE LGRDLFVRCL YGMRISLSIG IVATIINIVI 
GVLYGGISGY IGGRVDNIMM RIVDILYSIP LMIYVILLSV SLKPALEALF DKYSFLSGLQ 
TVGAPLVCIY IALGLTYWIS MARIVRGEIL SLKQQEYVTA AKTIGASGWR ILLRHLIPNS 
MGSIIVTATL QIPSAIFTES FLSFIGLGVD APVPSLGSLA SDGVNGFISY PYRLFFPSLL 
LCLIILAFNL FGDGLRDALD PRMRK