Gene Athe_2742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2742
Symbol
ID	7408312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2891654
End bp	2892967
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	33%
IMG OID	643717098
Product	hypothetical protein
Protein accession	YP_002574567
Protein GI	222530685
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGAT TCAATCCATT TGTGAATGGT TTTAATAAAT TAAGAAATTT TACAAGGACT 
GTATATCTGT ATGGATGTTA TTCAAGAGAA GATGCAGAGA ATTTTAACAT TGCAAAAAGG 
ACATTTGATG ATGAGCTTCG AAGAATTAGA ATTTTCTTAG GGGAAGACCA GTATTTTTCA 
GCAGAAAAAG AAGGGAAAAA ATCCCTGCCA TGCATTGTAG AAAACTTTTT CAGAGATGTT 
GAGAATCCAC TTATAAACAT ATATTTTTCG AAAACTTCTA CTGCACTGCA AACAACCTTG 
TTTTTTATGG TATTGCAGAT ATTAAACTTG TCAGAAAACA AAAAAGCAAC TTTTACTCAG 
ATTTCAAACG AAATATCGCA GGTACTTGAT GAAGATGTTG CTGATGCTGG ATTTGAGTCC 
AGCCTGAAAA GAGTCTTAAA ACAACTTCAA AATTTGGGTA TTGTGAAATA TTTAAAAAAT 
GAAAAGGTGT ATATGCTATG TTCTCAAATA AAGGATGTAT TAAAAGATTT TTCAATAGAT 
GAGATAAAAG ACATTTATAT ATCTATTTTA TTTTTTATAA ACACGAATGT TCCCAACGTT 
CCGGGATGGT ACTTAAAAGA AAGTCTGGAA AAATACCTTT TAGAACTTGG CGAAGAAGAG 
TTTTTAAAGG ATACAAACAG ACTATTTTGG TTTACATACG TTCCACACCA CTATATCCTT 
GAAGAGGAAC TTGTATGGAA ATTTTTAGAG GCAGCATCAA ACAATAAAAA GATAAAGGTT 
TGGTACTATC CACGCCAAAA AAGACATTTA TCAGATTTTT CATGCATACC AGTGAGAATA 
ATTTATGATG TAAAGCTTGG AAGATGGTAT TTTATGGTAT TAAGGGGAGA AGATTTATCG 
GCATTGCCAG TGTGGCGCAC AGAAAAGATA GAGATTTTGC AGGAAGATTT TGACCCGCAA 
AAGATTTCAC CTTTTGTAAA AAAGATTGAA AAATGTTTTT TTGTATCTGT TCCGAACAAT 
AAAAAAGGAT TTAAAAAGAT TAAGATTATG TTTAAATGCC CGCTGGATTC GCCGTACAAC 
TTTGTGCTTG CAAGGGTGAA AAGAGAGCTA AAAAACGCAA GAATAACCAA AATTGATGAG 
AGAACATTTG AAGTGGAGCA TGATATTAGC AATATAAAAG AGTTTAAGGG ATGGCTGAGA 
AGTTTTGGTG AAAGAGCTGT TGTGCTTGAC GATACTGAAG CTGGAAGAGA ACTCAAAACA 
GAAATGATAA ACGAATGGAA GGAGATCCTG AGAAACTATG GAGATTTTTA TTGA

Protein sequence

MSGFNPFVNG FNKLRNFTRT VYLYGCYSRE DAENFNIAKR TFDDELRRIR IFLGEDQYFS 
AEKEGKKSLP CIVENFFRDV ENPLINIYFS KTSTALQTTL FFMVLQILNL SENKKATFTQ 
ISNEISQVLD EDVADAGFES SLKRVLKQLQ NLGIVKYLKN EKVYMLCSQI KDVLKDFSID 
EIKDIYISIL FFINTNVPNV PGWYLKESLE KYLLELGEEE FLKDTNRLFW FTYVPHHYIL 
EEELVWKFLE AASNNKKIKV WYYPRQKRHL SDFSCIPVRI IYDVKLGRWY FMVLRGEDLS 
ALPVWRTEKI EILQEDFDPQ KISPFVKKIE KCFFVSVPNN KKGFKKIKIM FKCPLDSPYN 
FVLARVKREL KNARITKIDE RTFEVEHDIS NIKEFKGWLR SFGERAVVLD DTEAGRELKT 
EMINEWKEIL RNYGDFY