Gene Noc_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1937
Symbol
ID	3705474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2214795
End bp	2216084
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	49%
IMG OID	637738413
Product	VanZ like protein
Protein accession	YP_343929
Protein GI	77165404
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATAATC TCCACGCTAA CGGGAGATTA TGCATGATGT ATTCCAAAGG GCAGGCTAAA 
CCATTTCGCT TATTGTCGGT AATCATCTAC GCGGGATTGC TGGCTTATGG TACCCTCTAT 
CCGTTGCATG ATTGGCGAGT CCCATTGGAA TCGGGGTGGT TGCCTATTTT TGGGCACGGA 
TCGAAAGTTA GCTATTCAGA TATTTTTACC AATATTGTCG TCTATATCCC GTTAGGTTTC 
TTGCTTGCTC GCGCCGTTAT TTCCCGTTCC CCTATTGGCA AAATTATTGC TGCTCTTTTG 
GGAGGAACGG TATTAAGTTT TTTGCTTGAG TCCTTACAGG TTTACCTACC CAGCCGAGTA 
TCTTCATTCC TAGACTTAGC GCTTAACACT ACGGGAGCCC TTGCGGGCGG CTTGCTCTTC 
GTTGCGGTAC GTCCCCAAGG CCGGATTTAT GAGTGTCTAC TTTCATTGCG TCAAGCCCAC 
ATACGGCCTG GAGCGTTAGC CAGCGCAAGC ATGTTTTTGT TAGGGTTGTG GGGGCTTTCT 
CAAACCAGTC CATGGGTTCC GTCGCTTGAT ATCTCTGGCC TGCGTCAGGA ATTAAAGCCG 
TTATGGTATA CGTTGACACA GCAAATCCCC CTCGATTTTA ACCAGATGGT AGTATATATT 
TTGACCATCA TGGCGCTGGG CACGGTGGGT GCCGCAGCCT TAAAATCCGA TAAATCCGCG 
TTTTGGTGGT TTGCGGTATT CATTAGCGCG GTGCTATTGT TTAAAATACC CGTGGTGGGT 
CGCCCGCTCT CTGCTGAGGC CCTTGCAGGT GCGGGAGTAG GGGTAGTGGG ATTTGCCTTG 
CTGCGGCAGT TACCAGCAAG GGGTGCTATT GTAAGCAGTA TCGTTGCCAT TCTTGGGGCG 
GTTATTATTG ACGAACTACG CGTTGGGACA ACGTGGCTAA TCTCTAATTT TAACTGGATA 
CCTTTCAAGG GGCACTTGAC TAGCACCGTG ATTGGCATTG TTGATACGCT CATTGGTGCT 
TGGCCTTTTT TTGCCCTTAG TATACTGGTA CTTCATCTTC GCCCCCAACG GCCCAGAAGG 
ATACTGGTCT GGGGAGGAAT CGGGGTGTTT GTTGGGATGT TCACCTTGGA ATGGAATCAG 
CAATACATTG CAGGCCGATA CCCTGATATT ACTGATGCTG TATTGGCTTT ACTTGCTTGG 
TGGTTACCTT GGTTCTACAC GCCATTACGC CAGGAAATAC GTAGGCACCA TTACCCGGAT 
TTAAAAGGTA ATCTTAGAGA AAGCGGATGA

Protein sequence

MHNLHANGRL CMMYSKGQAK PFRLLSVIIY AGLLAYGTLY PLHDWRVPLE SGWLPIFGHG 
SKVSYSDIFT NIVVYIPLGF LLARAVISRS PIGKIIAALL GGTVLSFLLE SLQVYLPSRV 
SSFLDLALNT TGALAGGLLF VAVRPQGRIY ECLLSLRQAH IRPGALASAS MFLLGLWGLS 
QTSPWVPSLD ISGLRQELKP LWYTLTQQIP LDFNQMVVYI LTIMALGTVG AAALKSDKSA 
FWWFAVFISA VLLFKIPVVG RPLSAEALAG AGVGVVGFAL LRQLPARGAI VSSIVAILGA 
VIIDELRVGT TWLISNFNWI PFKGHLTSTV IGIVDTLIGA WPFFALSILV LHLRPQRPRR 
ILVWGGIGVF VGMFTLEWNQ QYIAGRYPDI TDAVLALLAW WLPWFYTPLR QEIRRHHYPD 
LKGNLRESG