Gene Noc_1457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1457
Symbol
ID	3706026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1612979
End bp	1614130
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	55%
IMG OID	637737946
Product	YVTN beta-propeller repeat-containing protein
Protein accession	YP_343475
Protein GI	77164950
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.803154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TTGATGGTTT TATGGTGGCT TTGTTAGCAG GGGGAGCAGG GCTGATGCTA 
AGTGCTACGG ATAGTGTTCT AGCCGCGGAA AGCAGCGGTT CAGGGCAGGA TAATCAAGGG 
CTCCAGGCGA AGCTTTATGT CACCCTGGAG GAGCCGGATG CGTTGGGAAT CGTGGATCCA 
AAGTCCAAGA AAGGGCTAGG GACGGTTGCT GTCGGTGGGA AGCCCCATGA TGTGATTTGC 
GCCCCGGATG GGGCGACGGC CTATGTCACC AATCCAGAAA CCCACAACCT GAGCGTCGTG 
GATACAGCAA CGGATAAAGT CAAAAAAACC GTGGAATTTG GCCAGGGAAC GACCCCCTGG 
CATGTGGAAA TATCCCCGGA TGGTTCTCAG GTCTTTGCCG CCCTCCAGGA TCAATCAGCG 
GTGGCGATTA TTGCTACCGC TGATAATCAT TTAGCGACCA AAGTTTCGGT GACAAGCGGT 
CCCTGGGGGG TGGCTGCCCC TAAAAACGGA CCTTGGGCGG TGGCCGCCCC AAGGAATGAT 
GTCGTTTACG TCACGCTCAA TGGGAGCATT ACCAAAGGCA CGGCGAATGC AGCCCGCAGT 
GAAGATATTG CTGTGTTTGA TCCAACGGCG GCTGTACCTA CCGTGAAATA TGTGACCCTG 
GCGGCGGACA CGGCCAATGG ACCCCACGGG ATCGTATCAG CGCCGGATGG ATCGGCGGTT 
TATGTCGCCG CCGAGGCAAG TCATGAAGTA TGGAAAATCC AGGTGGACGG CAACCAGGCA 
AAGCGGGTAG TCGAAATCCC TGATCCTAAT CCTGCTGGAA CGCCTCTTAA CCCAGGCTTC 
CCCACGGATC TGGGCATCAG CCCCGACGGT AATACGCTCA TTGCCGTTAA CCACGACCTT 
GACTCCATAA CGGTAATTAA TCTGAAAACC CATAAAATCA TCGAGACGGT CAGCACGGGT 
GAAGGCAGCG CGCCCTGGGG AGCGTTGATT TCGCCGGATG GACAGACGGC TTATATCTCC 
ACCAACGGCG CGGACAGCCT TGCCTTTTTT TCCATGAAGG AACTCACCGA TGGGACGGAA 
GGGGCCCGCA AGCATACCAT CGCGGATTTG CCCACTTCAG ATGGCCTCGC GTGGTGTAAT 
TTGGCCCAAT AG

Protein sequence

MKKIDGFMVA LLAGGAGLML SATDSVLAAE SSGSGQDNQG LQAKLYVTLE EPDALGIVDP 
KSKKGLGTVA VGGKPHDVIC APDGATAYVT NPETHNLSVV DTATDKVKKT VEFGQGTTPW 
HVEISPDGSQ VFAALQDQSA VAIIATADNH LATKVSVTSG PWGVAAPKNG PWAVAAPRND 
VVYVTLNGSI TKGTANAARS EDIAVFDPTA AVPTVKYVTL AADTANGPHG IVSAPDGSAV 
YVAAEASHEV WKIQVDGNQA KRVVEIPDPN PAGTPLNPGF PTDLGISPDG NTLIAVNHDL 
DSITVINLKT HKIIETVSTG EGSAPWGALI SPDGQTAYIS TNGADSLAFF SMKELTDGTE 
GARKHTIADL PTSDGLAWCN LAQ