Gene Nther_1872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_1872
Symbol
ID	6315043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	1959517
End bp	1960587
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	31%
IMG OID	642644254
Product	putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
Protein accession	YP_001918032
Protein GI	188586487
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000000802014
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.278856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTGGCA AAATGAGTTT ATGGGTATTA ATTCTTAATT TTTTATTAAC TATGAATCTT 
GGGGGTTATA ATATAAACCA TATCGATTGT AACCTAATAC ACGTTTTTGA AGAAATGAAA 
AAAGAGTATC AAACTAAGGA AGAAGTCGTA AACAACGATG AAGTAAAATC TATAATTATA 
AGTGTTGCTG GTGATACAAC TCTTGGTTAT GATGAAGATT TTGGTTATTA CAATAGTTTT 
GATCATGAAT TTGAAAGACA AGGCAAAAAT TATAATTATT TTTTTAGCAA TGTAAAAGAA 
ATTTTTAAAG ACAGCGATAT TTCAATTTTA AATTTAGAAG GTACCTTAAC AAATCATGAT 
CAACCTAAGA ACAAAAAGTT TACTTTTAAA GGTAAACCAG AGTACGCCAA AATTTTGAAA 
AAAGGGCATA TTGATGCAGT AAACCTGGCA AATAACCACA CTATGGATTT TGGAAACAGA 
GGGTTTCAAG ACACTAAAAA ATCTTTGGAA CAAAAAGGAA TTGGCTACTT CGGCTATGAC 
CTGGAATTTA CCAAAGAAGT GAAAGGTAAA AAGTTTTCTA TATTAGGATT CACCGGATGG 
TACGTTAATC AGGAGCGAAA AAATTATTTG AGTTCAAGAA TAGAACAGGC AAAAGCAAAC 
TCTGATGCAG TAATTGTCAC TTTTCACTGG GGAAATGAGT ATGAATATGT CCCTAATGAT 
ACTCAAAAAG AATTAGGAAG ATCGGCCATA GAAAGCGGTG CAGATATGGT ATGGGGGCAT 
CATCCTCATG TGCTTCAAGG GATAGAACAA TACGAAGAAC GCTATATAGC TTATAGTTTA 
GGAAACTTCT GTTTTGGTGG TAATAAAAAT CCTTCAGATA AAGATAGTAT GATATTCCAA 
AACGAATTCA AATTTAAAAA TGGTAAAATT GAAGAAGTAG ACCACAATAT TATTCCCATA 
AGTATATCTT CTAAAAAGGA GCGAAATAAT TATCAACCTA CTCCAGTCCA GAATAAAGAA 
AAAGAAAGAA TCAATGAGAG AATAAAAGAA TTAAATAAAA AAATAGATTA A

Protein sequence

MIGKMSLWVL ILNFLLTMNL GGYNINHIDC NLIHVFEEMK KEYQTKEEVV NNDEVKSIII 
SVAGDTTLGY DEDFGYYNSF DHEFERQGKN YNYFFSNVKE IFKDSDISIL NLEGTLTNHD 
QPKNKKFTFK GKPEYAKILK KGHIDAVNLA NNHTMDFGNR GFQDTKKSLE QKGIGYFGYD 
LEFTKEVKGK KFSILGFTGW YVNQERKNYL SSRIEQAKAN SDAVIVTFHW GNEYEYVPND 
TQKELGRSAI ESGADMVWGH HPHVLQGIEQ YEERYIAYSL GNFCFGGNKN PSDKDSMIFQ 
NEFKFKNGKI EEVDHNIIPI SISSKKERNN YQPTPVQNKE KERINERIKE LNKKID