Gene Athe_2433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2433
Symbol
ID	7408057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2577233
End bp	2578909
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	41%
IMG OID	643716796
Product	hypothetical protein
Protein accession	YP_002574274
Protein GI	222530392
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCGCA AAAGAATGAT TGACCCTTCA ATATGGAGCG ATGAGAAATT AGGACTGCTA 
TCCCCATTAC ATCGGTTGCT GTTTATAGGT CTGTTTTCAA ATGCTGACGA CGAAGGAAGA 
TTACCCGGTC ATCCAAACTA CATTAAATCA CTGATTTTCC CCTATGATAA TGATATCACA 
CCACAGAACG TTGAAGCAAT GCTCAATGAT TTGAACAGAA AAGGTTTTAT CCTGACGTAT 
ATGGTTAACG GACAGCGGTA CATCCAGGTT GTTAATTTTC TTAAATACCA GAAAATTAAC 
CGACCTACGC CTTCTAAAAT TCCCCCACCA CCAGTAGAAA CAACTGTAAA AAATGCTACA 
TCATGTTTCA GTGAGTCCTC ACTGAATACT CATGGAGTAC TCAATGAATA CTCATTGAAT 
ACTCACGAAG TATTCAATGA AAACTCATTG AATACTCATG AACAATTCAC TGCCCAAATA 
GAAAAAGAAA AAGAAGAAGA AAAAGAAAAT AAAAATAATA GGGATGTAGT TACTAACGTA 
ACTACATCAC GCACTGGCTC TGACGAGCCT ACGTGCGTGG CTGAAGAGCA CAAGATTTCT 
ACTTCTACCC AGAAGAAAAA ACTAGAAGGT AAACAGGAAA TGGCAGTTAC TTCCGACCCA 
GAGCAGGTAA CCGAAACTGC AGTACTAATC GATACAAACA ACAACGCTCT AAATACTACT 
GGGGAAGATG AGATAGAACA GTTGCTTGAA GACTTTTTCG AGGACAATGA TGAAATAGCC 
GAGAACCAGG ACACTGCTAA AACCAAGGAA CCCTTAATTG CTACTGGGGA AGGTGAAAGG 
GAAAAACCTT CAGCCCCAGT AGAAAACCCT GAAATTCTTG AAACTGCTAA ATCCAGGGAA 
CGTCTAAATA CTACTGGGGT AGAACTGGTA AACAGCAAAG AGTGTAATAC AATACCGCAC 
GACCAGACCA CTTTTAGAAC ACAGGACCAT CTAATTGGTG ATGAAGAAGA AATTGAAAAA 
CTGCTTGAAG AGTTTTTTGC TGACGTGCCC GCCCCGGCAG GTGCACCCAC CTCAATCATG 
CCAGCTAACA TTTCGCCACT TGCTGATGTT GATACAACCG CAGTTTATGA CTCAGCCGGG 
TTTGTATCCA CCGCACATGT GCAGACAGAT TATGATACTG GTACCCTGCC CAGCAGCCAG 
AAGGGAACGA ACACAGGTAA CACATATACT GTATCAGATT CCGGGGTTGC AACAGCGATT 
GTTACAAGCA ATACTCCTGG AGTAGAAAAT TACCAGGAAG AACCAGTCGA AAAGCCACCG 
GAACTAACAA ATCGTGAACT AATCGGTATT CTCACGCATA AATTTCACGA GATAACAGAA 
CCGCTTAAAT ACCGTTCTGA TTACTCATAC ATTGGCGGTT TGTACAACAC GTTCAATTAT 
TTCATTGTCG ACAAAGCCCT TGACAGACTC AGGAGAAAAG TTGAAAAAGA TGGACCTATG 
GACAACATAA AGAGCTATCG TGCTTATCTA GCCCGGGTTT GTATAAATCT CAAACAGGAA 
TGTGTAGTTC CTGCAGAAGC ACAAAAACAA AAGAGACAGG GTTTAAAAGT CAGAACTCTT 
AAAGTTTCAA CTGAAGAAAT AAAAAAACAA ATAGAAACAC AGGCTAAACT TTTCTGA

Protein sequence

MARKRMIDPS IWSDEKLGLL SPLHRLLFIG LFSNADDEGR LPGHPNYIKS LIFPYDNDIT 
PQNVEAMLND LNRKGFILTY MVNGQRYIQV VNFLKYQKIN RPTPSKIPPP PVETTVKNAT 
SCFSESSLNT HGVLNEYSLN THEVFNENSL NTHEQFTAQI EKEKEEEKEN KNNRDVVTNV 
TTSRTGSDEP TCVAEEHKIS TSTQKKKLEG KQEMAVTSDP EQVTETAVLI DTNNNALNTT 
GEDEIEQLLE DFFEDNDEIA ENQDTAKTKE PLIATGEGER EKPSAPVENP EILETAKSRE 
RLNTTGVELV NSKECNTIPH DQTTFRTQDH LIGDEEEIEK LLEEFFADVP APAGAPTSIM 
PANISPLADV DTTAVYDSAG FVSTAHVQTD YDTGTLPSSQ KGTNTGNTYT VSDSGVATAI 
VTSNTPGVEN YQEEPVEKPP ELTNRELIGI LTHKFHEITE PLKYRSDYSY IGGLYNTFNY 
FIVDKALDRL RRKVEKDGPM DNIKSYRAYL ARVCINLKQE CVVPAEAQKQ KRQGLKVRTL 
KVSTEEIKKQ IETQAKLF