Gene Athe_0643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0643
Symbol
ID	7406984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	729935
End bp	731272
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	40%
IMG OID	643715024
Product	glutamine synthetase, type I
Protein accession	YP_002572540
Protein GI	222528658
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.61132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATT ACACCAAGGA AGACATCATT CGCATATGCA AGGATCAAGA TGTAAAATTC 
ATAAGGCTTC AGTTTGTCGA TATTTTTGGG ATTTTAAAGA ATGTTGCAAT TACAGTTGAT 
CAGTTAGAAG CAGCTCTCAA CAATGAAATT ATGTTTGATG GTTCGTCAAT TGAAGGTTTT 
GTAAGAATTC AGGAATCAGA TATGTATTTA AGACCAGACC TCAACACATT TACAATCTTC 
CCATGGAGAC CTTCACCAAA TAGAGTTGCA AGATTAATTT GCGACGTTTA TCTTCCAGAT 
GGAACACCGT TCCCTGGCTG TCCGCGCGGT GTGTTAAAGA AGATGCTCAA AAAGGCTGAA 
GAAATGGGAT TTAAGTTTTT TGTTGGGCCT GAGCTTGAAT TTTTCTTGTT CTTAACAGAT 
GAAAATGGAA ATCCAACTTT GCAAACACAT GACAATGCAG GATATTTCGA TTTGGGTCCA 
GTTGATTTGG GTGAGGATGC AAGAAGAGAC ATGGTATTGA CTTTAGAGGA GATGGGATTT 
GAGATAGAAG CATCTCACCA TGAAGTTGCA CCTGGCCAGC ATGAGATTGA CTTTAAATAC 
GACGACGCAC TTTACACAGC TGACAATGTT GTGACATTCA AGCTTGTTGT AAAGACAATT 
GCACAAAGAC ATGGTCTGCA TGCAACATTT ATGCCAAAGC CGATATTTGG AATCAATGGT 
TCTGGAATGC ATACAAATAT GTCTCTTGCA AGGGTATCTG ACGGCATGAA TGCATTTTTA 
GACCCAAATG ATAAGCTCCA GCTTTCAAAA GAGGCATATT ATTTCATTGG TGGTCTTATG 
AAACATGCGA GAGAGTTTGC GCTTGTTACA AATCCACTTG TAAATTCATA CAAGAGATTA 
GTACCAGGGT ATGAAGCACC AGTTTACATT GCTTGGTCAC CAAAGAACAG AAGCCCGCTT 
ATAAGAGTTC CAGCTAAAAG AGGGCAAGCA ACAAGGGTTG AGCTAAGGAA TCCTGATCCA 
TCAGCAAATC CATACCTTGC ATTTGCAGCT GTTTTAGCAG CTGGGCTTGA CGGCATTAAG 
AACAAGATTG AGCCACCAGA ACCAGTTGAA GAAAACATCT TCGTAATGAG CGAAGAGGAA 
AGAGCAAAAC GTGGAATTGG AAGCCTACCA GGAAGCTTAG AAGAGGCAAT CAAAGAGTTT 
GAAAACAGCG CTCTTATGAA AGAGACACTT GGAGACCACA TCTTTGAAAA GTACTTAGAA 
GCAAAGAAGC TTGAATGGGA TGATTACAGA ACAAAAGTAC ATCAATGGGA GATTGACTCA 
TATCTTACAA AATACTAA

Protein sequence

MKNYTKEDII RICKDQDVKF IRLQFVDIFG ILKNVAITVD QLEAALNNEI MFDGSSIEGF 
VRIQESDMYL RPDLNTFTIF PWRPSPNRVA RLICDVYLPD GTPFPGCPRG VLKKMLKKAE 
EMGFKFFVGP ELEFFLFLTD ENGNPTLQTH DNAGYFDLGP VDLGEDARRD MVLTLEEMGF 
EIEASHHEVA PGQHEIDFKY DDALYTADNV VTFKLVVKTI AQRHGLHATF MPKPIFGING 
SGMHTNMSLA RVSDGMNAFL DPNDKLQLSK EAYYFIGGLM KHAREFALVT NPLVNSYKRL 
VPGYEAPVYI AWSPKNRSPL IRVPAKRGQA TRVELRNPDP SANPYLAFAA VLAAGLDGIK 
NKIEPPEPVE ENIFVMSEEE RAKRGIGSLP GSLEEAIKEF ENSALMKETL GDHIFEKYLE 
AKKLEWDDYR TKVHQWEIDS YLTKY