Gene Athe_1242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1242
Symbol
ID	7409716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1331365
End bp	1332648
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	31%
IMG OID	643715607
Product	hypothetical protein
Protein accession	YP_002573115
Protein GI	222529233
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.684679
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATA CTTTTAGAGT TAGATTGAAG CAGCAGGTTA TTCCAGCTAT TTTGTACTTG 
ACCTTTTTGA GTGGTTTTTT TGGGAGTACT CTTGCGTATC CAAAGCTAAG TTACCTTTTT 
GCATATAGAA TATTTTTGGC ATTTTTGTTT TTTCTCATTT TTATCGACAT AGTATTAAAT 
GGAATTGAGC TGAAGAGTTT TCTTAACTTT TCGACTTTTT TTCTAATAGG GTGGTGTGCC 
TACTCACTTT TAAGTTTTTT ATGGGCTCAG GATATAAAAA GTGCAGTGAG GGACCAGATT 
TTTTTAACCG TCAATATATT TGTGATACTG ATATTTATGT ATTACTCAAA ATATCTTAGA 
TGGAATATAA TTGAAAACAT AATATTAATT TCATTTATCA TCCATCTTGC TGTAGGCTAT 
TTCGAAGTAA TTACTGACAA ACATTTGTGG ACATCTAAGG TACCTTTATA TAATCTTCAT 
AGAACACCCT CAACCTTTTT TACAAATCCA AACGATTTTG CAACATATTT GGTTTTATAT 
TTGCCATTTA TTTTAGCCGT TGCAGTAAAC AAGAAGAATA ATAATTTTTT CAGAAAATGG 
ACAGCCTTTT TAGGCACAGT TTTGGTTATT CCTCTTTTAA TTCTTACAAC AAGTAGGGCA 
AATTACATAG GATTTTTGAT AACTTTGATT ATTTATTTTC TTTTAACAGA TAAAGACCTG 
AAAAAGAGTC TTCTACAATA TGGAGCTATA CTTTTAATTT TTTTAATGCT TATAATAGGT 
TTTAGACTGG ATTTTGGAGC GTTTAATAAG GCAGTTGAAA TGATAAAAAT TCAGATTTCT 
TCGCTTGCTG ATTTTTCGCA GACTTCTCTT TCCTCTAATG TACGGCGTGA GCTTTTGATT 
GTGTATGGTC TTTCGTTTTT ATACGACTAC CTCTTTTTTG GTGTTGGTTC AGGCAACAGC 
AGGGTTTTGA TGGAAAAGGT AAAACAGTAT ACTGTAAATG TTGAACTTCA TAATTGGTTT 
TTGGATGTTC TTGTGTGTTA CGGCGTGGTA ATATTCATCT TGTATCTTAT TTGGATAGTC 
TATATACTTT ACAATCTTTT TGAAATAAAA AAGAGCAGTA ATACTTTAAA CCTACCAACA 
ATCCCTTTAA TAAGCTCTAT TTCTGCATTT TTTATATCAA GCATAAGTTC ATCGAAGATG 
ATAGAGATGA GGGTAATGTG GTTTATATTT GCACTTTCGC TGTTTGTTTT AGTAAAGTCA 
AAAGAAGAAA AAGGAGAGTC TTGA

Protein sequence

MENTFRVRLK QQVIPAILYL TFLSGFFGST LAYPKLSYLF AYRIFLAFLF FLIFIDIVLN 
GIELKSFLNF STFFLIGWCA YSLLSFLWAQ DIKSAVRDQI FLTVNIFVIL IFMYYSKYLR 
WNIIENIILI SFIIHLAVGY FEVITDKHLW TSKVPLYNLH RTPSTFFTNP NDFATYLVLY 
LPFILAVAVN KKNNNFFRKW TAFLGTVLVI PLLILTTSRA NYIGFLITLI IYFLLTDKDL 
KKSLLQYGAI LLIFLMLIIG FRLDFGAFNK AVEMIKIQIS SLADFSQTSL SSNVRRELLI 
VYGLSFLYDY LFFGVGSGNS RVLMEKVKQY TVNVELHNWF LDVLVCYGVV IFILYLIWIV 
YILYNLFEIK KSSNTLNLPT IPLISSISAF FISSISSSKM IEMRVMWFIF ALSLFVLVKS 
KEEKGES