Gene Nmul_A1677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1677
Symbol
ID	3785664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1918218
End bp	1919084
Gene Length	867 bp
Protein Length	288 aa
Translation table	11
GC content	57%
IMG OID	637811763
Product	hypothetical protein
Protein accession	YP_412367
Protein GI	82702801
COG category	[S] Function unknown
COG ID	[COG5563] Predicted integral membrane proteins containing uncharacterized repeats
TIGRFAM ID	[TIGR02595] PEP-CTERM putative exosortase interaction domain [TIGR02913] probable extracellular repeat, HAF family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACTA CTCCTAGCTC TAAAATCCAC AGCCTGATTC TGGGGGCAGC CCTGAGTATC 
GCACCTGGTT TTGTTTCCCC TGTCTCCGCA CAGGAACGTT CATATATCCT CAACTTCTAT 
GACAACAGTC TAACCGATCT CGGGACGCTG GATCTGGGTG GAGGTTCCAG TTACGCCCGT 
GGCATCAATG ATACCGGGCA GGTGATGGGG GAGTCCCTTC TTCTAGGCGA CCCGAATAAT 
GCGCACGCTT TTATCACCGG TCCCAATGGT GTGGGCATGA CCGATCTCGG GACGCTAGGG 
GGAATGTGGA GTACTGCCAA CGACATCAAT AATGCTGGGC AGGTGGTGGG GAGCGCAGGC 
ACGGCCGCAG GTGAGCGTCA CGCTTTTATC ACCGGCCCCA ATGGCGAGGG CATGACCGAT 
CTCGGGACGC TGGGGGGAAA TTACAGTACC GCCAACGACA TCAATAATGC TGGGCAGGTG 
GTGGGGTGGT CCACCACGGC CTCAGGTTCC GAGCACGCTT TCATCACTGG TCCTGATGGC 
GTGGGCATGA CAGATCTCGG GACGCTGGGG GGAAATTACA GTACCGCCAA CGACATCAAT 
AATGCTGGGC AGGTGGTGGG GAACTCCGCC ACAGCCGCAG GTGAGGGACA CGCTTTTATC 
ACCGGCCCCA ATGGCATGGG CATGACAGAC CTCAATTCGC TGGTTGAGTG GCCAGCCGGA 
ATTGCTCTAG CGAACGCTGT CGACATCAAT AACGTGGGAC AGGTCCTCGT CAATGCTGCG 
ATCCCTGAGC CTCAATCCTA TGCTTTGATG CTCGCGGGCC TCATGCTGGT CGGATTCATG 
GTTCGGCGAA AAAGCCTGCC GGCATAA

Protein sequence

MKTTPSSKIH SLILGAALSI APGFVSPVSA QERSYILNFY DNSLTDLGTL DLGGGSSYAR 
GINDTGQVMG ESLLLGDPNN AHAFITGPNG VGMTDLGTLG GMWSTANDIN NAGQVVGSAG 
TAAGERHAFI TGPNGEGMTD LGTLGGNYST ANDINNAGQV VGWSTTASGS EHAFITGPDG 
VGMTDLGTLG GNYSTANDIN NAGQVVGNSA TAAGEGHAFI TGPNGMGMTD LNSLVEWPAG 
IALANAVDIN NVGQVLVNAA IPEPQSYALM LAGLMLVGFM VRRKSLPA