Gene Nmul_A0957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0957
Symbol
ID	3785748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1109884
End bp	1111026
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	56%
IMG OID	637811040
Product	squalene/phytoene synthase
Protein accession	YP_411652
Protein GI	82702086
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCCTCCT GTGCCAGAGC AGATAATGTT CTGCCCTTTG CGTTAACGGT TCCGGAATTT 
CCATCCTTGA CTACTCCCTC CACCAGACAC GAACTGCTGC ACGACATCCT CAAGCAGGTT 
TCCCGTTCGT TTTATCTCAC GCTCAATGTG CTGCCTATCG GAGTGCGCGA GCAGATGGGC 
CTGGCGTATC TGTTTGCGCG TGCCGCCGAT ACCATTGCCG ACACGGATCT GATCGACCGG 
GCAGAGCGTC TGAAATACCT GAACCAGTTC CGTGAGCAAT TCATGACGGC CAGGATTGAT 
CGGAAAGCCG TTCAGGAGAT TCAGAGCGCG CTGGTCCCTC ATCAGAAAGA CTCGGGAGAA 
AGCATTCTTC TGCAGCGGCT AGAGGATTGT TTCAGGCTGT ACGAGGAGTG CTCGCCCGAT 
GACCGGAAGC GCATCCAGTG GGTTATAAAG GTACTCACCG AAGGGATGGA AATGGACTTG 
AACCGCTTCC CCGGCCAGTC AGGTAACCAA CTTGCAGCGC TATCCACTCT GGACGACCTG 
GACCAGTACA CTTACCATGT CGCAGGTTGT GTCGGGGATT TCTGGACCAG GATGATTTGT 
GCTCATCGGC CGACGATGGG ACGATGGGAT GTGGAGGAGA TGGCAGCCAT CGGGGTAAGG 
TTCGGGAAAG GGCTGCAACT CACCAACATT CTGAAGGATA TCGGCCGGGA CCTGCACAAT 
GGCCGCTGTT ATATTCCCGA ATCGCTTCTC GATGAGGCAG GCCTGAAGCC CGCGAACCTG 
TTGAATGACA GCAGCCTGCC AAAATTCAAA CCGGTTCTCG ACCGCCTCAT CAGGATGGCC 
ATCGAGCACC TGGATCAAGG CTGGATTTAT ACCATGGCGA TTCCTGTCTC GGAAATTCGT 
CAACGGCTGG CCTGCATCTG GCCTATCCTG CTGGCCGGGG AAACCCTACG GCGTGTCGCG 
GTGACGCCCG ATCTGCTCGA CCCCGCCGTG TATGTCAAAG CGCCTCGAAG CGAGGTATAC 
CGGATAATGA CATTGACAAC CCTGACCTGC GCCAACGGCT TTGTTGCAAC CAGTTACTGG 
AACCGAGTCC GGGAACAGGT TGTCTCAGCC GTAGAGCAAT CACAGCAGAG CCGGCTGGCG 
TAA

Protein sequence

MPSCARADNV LPFALTVPEF PSLTTPSTRH ELLHDILKQV SRSFYLTLNV LPIGVREQMG 
LAYLFARAAD TIADTDLIDR AERLKYLNQF REQFMTARID RKAVQEIQSA LVPHQKDSGE 
SILLQRLEDC FRLYEECSPD DRKRIQWVIK VLTEGMEMDL NRFPGQSGNQ LAALSTLDDL 
DQYTYHVAGC VGDFWTRMIC AHRPTMGRWD VEEMAAIGVR FGKGLQLTNI LKDIGRDLHN 
GRCYIPESLL DEAGLKPANL LNDSSLPKFK PVLDRLIRMA IEHLDQGWIY TMAIPVSEIR 
QRLACIWPIL LAGETLRRVA VTPDLLDPAV YVKAPRSEVY RIMTLTTLTC ANGFVATSYW 
NRVREQVVSA VEQSQQSRLA