Gene Nmul_A1723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1723
Symbol
ID	3786200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1967093
End bp	1968073
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	55%
IMG OID	637811810
Product	putative glutathione S-transferase
Protein accession	YP_412413
Protein GI	82702847
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.959435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTTAC TCGTTAAAGG CAAGTGGGTG GACGAGTGGT ACGATACCAG ATCGACCGGC 
GGCCGGTTCA TCCGTACCAA TGCGCAGTTC CGCAACTGGA TAACGGCCGA TGGCAGTCCG 
GGGCCCACCG GCGAAGGCGG GTTTCCCGCC GAGGCGGGGC GTTATCATCT ATATGTCTCG 
CTTGCTTGCC CCTGGGCTTC CCGCACGCTG ATTTTTCGGA TGCTCAAAGG GCTTGAGAGC 
ATGATCAGTG TTTCGGTGGT GCATCCCTAC ATGGGCGAGC ATGGCTGGAC TTTTGATGAG 
GCGCCGGGAG TAATACCTGA TCCCGTGGGT GGCGCATCCT ATCTTTATGA AGTCTACCTC 
CGGTCGGTGC CTGACTATAG TGGACGCGTG ACAGTACCCG TGCTCTGGGA TTTGCAGCGG 
AATACCATTG TCAGCAATGA ATCGGCCGAT ATCATCCGCA TGATGAACTC GGCTTTCGAT 
GGAATAGGCG CTTTGCCCGG GAATTATGCG CCTGAGGTAT TGCTTCCACA GATCGCCGAG 
ATCAATGCGC GCATTTACGC TGACGTCAAT AATGGCGTTT ACAAGGCAGG TTTTGCCACT 
AGGCAATCGG TATATGAGAA GGCGGTGATG GTGCTGTTCA GATGCATGGA CGAGCTGGAA 
CAACTGCTTT CACGTCAGCG TTATCTCATC GGCAACTGTA TCACTGAAGC CGATTGGCGG 
ATATTCACCA CGCTGATCCG CTTTGATCCG GTCTATCACG GCCATTTCAA GTGCAACCTC 
AGGCGTCTCG TGGATTATCC CAATCTCTGG GCCTACACAC GGGAGTTGTA TCAATGGCCG 
GGTGTGGCAG AGACTGTGAA CATGCAGCAC ATCAAGGAGC ACTATTACCG CAGTCATCCC 
ACCATCAATC CGAATCGCAT TGTGCCGGTG GGCCCGATCC TGAATCTCGA TGAGCCCCAT 
GATCGCACGA AGCTGGCATA G

Protein sequence

MGLLVKGKWV DEWYDTRSTG GRFIRTNAQF RNWITADGSP GPTGEGGFPA EAGRYHLYVS 
LACPWASRTL IFRMLKGLES MISVSVVHPY MGEHGWTFDE APGVIPDPVG GASYLYEVYL 
RSVPDYSGRV TVPVLWDLQR NTIVSNESAD IIRMMNSAFD GIGALPGNYA PEVLLPQIAE 
INARIYADVN NGVYKAGFAT RQSVYEKAVM VLFRCMDELE QLLSRQRYLI GNCITEADWR 
IFTTLIRFDP VYHGHFKCNL RRLVDYPNLW AYTRELYQWP GVAETVNMQH IKEHYYRSHP 
TINPNRIVPV GPILNLDEPH DRTKLA