Gene Tpen_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1089
Symbol
ID	4602129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1026105
End bp	1027382
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	62%
IMG OID	639773866
Product	glutamate--ammonia ligase
Protein accession	YP_920491
Protein GI	119719996
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGGAG AAGACTTCGA AAGGGCTTTC AAGCAGCTCC GCGACAAGGG CGTAAAGTTC 
TTCGAGGTTG TATTCCAGGA TCTCGGAGGA GTTCTACGGG GCAGGGTTCT AAAGCCGGAG 
AAGCCCGACG ACGTTGCGCG CGGCTTCAGG ATAGACGCGT TCAGCACGGG TTTCAGCGGC 
GTCGAGGACT CCGACGCAAC GTTGCTACCG GACCTCTCCA CGCTGAGAGT ATACGAGTCC 
TCGATAGGTA GGACAGGCTT CCTCATAGGG GACCTCTACC GCGGGGGCAA GCCCATGGAG 
ACGTACCCGA GGAACCTGCT GAAGAAGTGG GAGGCGGAGT CCAGGTACAA GGTCCTGCTG 
GGGGCGGAGC TCGAGTTCTA CCTGGCGAGG GACTACAAGC CAGTGGACAA CGGCGGCTAC 
ATGTACGTCT CCCCCTACTC GACCGTGTAC CCCGTGATCG CAGAGATAGT CACGAAAGCG 
GAGGAAGCGG GGCTAGCGCT GAAAGCCGCG CACCACGAGG TAGGCCCCGG GCAGTACGAG 
GTGTTACCGA CGCCCATGAG CCCCCTAGCC CTCTCCGACG CCATAGTCTT CCTGAAGAAG 
CTCATATGGG AGGCTGCGAG CGCGAGAGGC CTCCAGGCCA CCTTTATGCC TAAGCCCTTC 
AACGGTTTGC CGGGCAACGG GCTCCACGTG CACATCTCGG TGCACGACGG CGACAGGAAC 
GTCCTCTTCG AGGACGGCGA GCTGACCGAG GAGGGCCGCT CCGTGATCGG AGGGCTACTG 
GCTTACACCG TCCCGCTTAT ACTGTTCACG AACCCCACTA TTAACTCCTA CAAGAGGCTC 
GTACCCGGCT TCGAAGCCCC GATCTACCTA ACCTGGGGGA GGGGGAACAG GTCCACGATG 
ATCCGGGTCC CGATGGGGCT TAGAGGCGCC TCGGGCGTCG TGGAGTACAG GCTACCGGAC 
TCCTCCGGGA ACGTGTACCT GAAGGCCCTC GCGGTCCTAT ACTCGGCGGA GAGGGGGCTG 
AGGGAGAGGG TAGACCCCGG GCCGGAGTGC AGGGTTAACG CCTTCCTCGC AGACGGGTAC 
CCGCGCATAC CGGGGACTCT CGGAGAAGCA CTCGAGAAAT CCCTGGAGTC TATCGGCAAG 
GCCCCGGAGC TAAGGGACCT GCTATCCAAG GTGGCCGAGC TCGAGAAAGG GGAGTGGCGC 
CGCTACTTGG AGGAGGCGGG CTCCCCAGAG GCCTCCGAAG TCACGGAGTG GGAGGTGAAG 
AGGTACTTCC TGGGCTGA

Protein sequence

MQGEDFERAF KQLRDKGVKF FEVVFQDLGG VLRGRVLKPE KPDDVARGFR IDAFSTGFSG 
VEDSDATLLP DLSTLRVYES SIGRTGFLIG DLYRGGKPME TYPRNLLKKW EAESRYKVLL 
GAELEFYLAR DYKPVDNGGY MYVSPYSTVY PVIAEIVTKA EEAGLALKAA HHEVGPGQYE 
VLPTPMSPLA LSDAIVFLKK LIWEAASARG LQATFMPKPF NGLPGNGLHV HISVHDGDRN 
VLFEDGELTE EGRSVIGGLL AYTVPLILFT NPTINSYKRL VPGFEAPIYL TWGRGNRSTM 
IRVPMGLRGA SGVVEYRLPD SSGNVYLKAL AVLYSAERGL RERVDPGPEC RVNAFLADGY 
PRIPGTLGEA LEKSLESIGK APELRDLLSK VAELEKGEWR RYLEEAGSPE ASEVTEWEVK 
RYFLG