Gene Athe_1974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1974
Symbol
ID	7407390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2086561
End bp	2087661
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	34%
IMG OID	643716348
Product	hypothetical protein
Protein accession	YP_002573834
Protein GI	222529952
COG category	[L] Replication, recombination and repair
COG ID	[COG3415] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTA TATCATATCA TGAAATGAGA AAAATATCTC CCGAAAAAGC AAGGGAATTA 
ATCCGAAAAG TGTTTGAAAA TAATAACAAA AACGTATCAA GAACTGCTAA AATATTAGGT 
GTATCAAGAC ATACTGTCAG AAGAGCAATA TATGGTCCCC TTGAGGATAA ATCAAGAAAA 
CCTAAAACTT GCCCCAGAAA ACTTTCTACT GAACTTGAAA ATCTCATTAT CGAGGAATCT 
AAAAGAACTG GCTTCAGATA CAGACGTTTG TCTCTTTACC TGCTCAGAAA ATATGGTATT 
AAAATAAGCG AAAATACAAT AAAGTCTATT CTCAAAAGAA ATGCTATACC AAAAAAATCA 
AGAAAGACAA AAAAGGGTGA AAGAAGTTTG TACGATTATG AAGCCCTCAT TCCATTTTCT 
GAATTTCAAC TTGATACAAA ACATCTTTTA GATAAAGACA GTCTTCCTGA AGAGGTATAT 
GAACATATGA AAAAACACAA TTTACCTTGC TATGAGTGGA ACATGATAGA CATTGCAACA 
AGAGCAAGAT TTACAGCCTA CTCCTATGAA CTTTCATCTG CTTTTGGCTT TATGTTTATA 
TCCTTGGTGG CTTTATGGCT AAGAACGCAT AATGTAAGAA ACCCAATAAA AATCCGATTG 
GACAATGGAG AAGAATTTTG CGGAGGAAGT GAAAGAAAGC TAAAGGAGTG GAATGAGATG 
TTTTCTATTT TGGGTGTAGA ACTAAATCCT ATTCCACCAA GAGCAAAACA TCTTATGGGG 
GTAATTGAAA ATTCACATAG AGCAGATGAC GAATATTTTT TAATGATTCA TGCCGAAAGA 
TGTAAAAACA AAGATGACTT TATTCAACGA GCTCAAAGGT GGCAGGATAC GTGGAACTTT 
TTTAGACCTC ATAATGGTAA AGGTATGAAT GGGAGGACAC CATTTGAAAA ATTCATAGAT 
TCTAAAACTC TGGTCTCCTC CCATGTGTTT CAGTTCCCTA CTTTACTTCT TGAAGACTTA 
TTAAAGAAAG TAGGAACTTT TTATTCTCTA TTCTGTAATA AATTAGGTGG TAAATATGTC 
TTCACCACGT GCCCTTTTTA A

Protein sequence

MNIISYHEMR KISPEKAREL IRKVFENNNK NVSRTAKILG VSRHTVRRAI YGPLEDKSRK 
PKTCPRKLST ELENLIIEES KRTGFRYRRL SLYLLRKYGI KISENTIKSI LKRNAIPKKS 
RKTKKGERSL YDYEALIPFS EFQLDTKHLL DKDSLPEEVY EHMKKHNLPC YEWNMIDIAT 
RARFTAYSYE LSSAFGFMFI SLVALWLRTH NVRNPIKIRL DNGEEFCGGS ERKLKEWNEM 
FSILGVELNP IPPRAKHLMG VIENSHRADD EYFLMIHAER CKNKDDFIQR AQRWQDTWNF 
FRPHNGKGMN GRTPFEKFID SKTLVSSHVF QFPTLLLEDL LKKVGTFYSL FCNKLGGKYV 
FTTCPF