Gene Noc_1942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1942
Symbol
ID	3705479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2222474
End bp	2223949
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	54%
IMG OID	637738418
Product	polysaccharide biosynthesis protein
Protein accession	YP_343934
Protein GI	77165409
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGAAA GCAAGACTGA GCCTGGTGTT CGGCACTCGA TAGTGGTTAC AACGTTGAAC 
CGCTATGCAG TTTTAGTGAT TTCCTTGGTC TCCACGATGG TGTTGGCGCG CTTGCTTACG 
CCGGCCGAGA TCGGCATTTT TTCCATGGCG GTGGTCTTCG TGAACCTTGC CCATTCCATG 
CGTGACTTTG GCGTAGGCCG GTACATCGTT CAGGAGAAGG AGCTTACCGT AGATCGTATC 
CGGTCCGCCT TCGGAATCAC GTTGGGTATC GCCTGGTCTA TGGCCATTGT GCTAGCAATT 
GCAGCGCCTT GGGTTGCTGA TTTTTATGGG GATGAAAGGG TGACAGGAAT CCTGCGGGTG 
CTTGCCGTTA ATTTCGTTTT AATTCCGTTT GGCTCCGTGG TTCTCTCTTA CTTGAACAGG 
GAAATGCAGT TTACCACTAT TTTCCTGGTG GGCGTCATTA GTGAATTTGT CCGGGCTGCG 
AGCGGTATTT GGTTTGCATG GATAGGACTT GGCGCTATGA GTTTAGCATG GAGCGCACTT 
CTTGGGGTAA TTGCCACAGT AGTATTGGCG CGTATTCTAG GGCCTAGCCA CTTCATCCTG 
CGCCCAGCAT TTTGTGAATG GCGGAGGGTT ATGAGCTTTG GCGGACGGGC CACGCTTGCA 
ACCATTGCAT TCCAGTTTCA GCGGGGAGCG CCTGAGGTAG TCATTGGCCG GTATTTGAGT 
GCTGCAGCGG TAGGTTTCTT CAGCAAAGCT CTTGGGGTTA TTCGGCTCTT CGACCGCACG 
GTGCTATCGG CGGTAAGCCC GGCAATTTTG CCCCACATGG CGGCCAAGCA CCGCTCGGGA 
GAGAGTGTCG CGGGTTTTTA TGCCCATGGG CTTGGGTTAA TTACCGCCCT CGCGTGGCCA 
TGCTATGCTT TTATCGCCAT CATGGCGTTC CCGGTGGTAC GAATTCTGTT CGGCGATCAG 
TGGGATGCTG CGGTTCCCCT GGCGCGCATT CTGGCCATCT ATGCGGCGGT CGATGCTTTG 
TATGCGTTTA CCGCGCAGGC GCTGATTGCG GTCGGTGCGG TACACCTGCT GGTGCGGCTA 
AGGGTGGCTA CCCTTTTAGC GACGGTTTTG GCGCTGGTGC TGGCTGTTTC TTATGGGTTA 
GAAGTTGTTG CTTTTGCGAT GGTTTTTCCG GCTGTAGTGG GGCTGATCTA TTCCTCTTTG 
CTGATGCGTT CAGCTATTGG TCTCAAGGGT AGGGTTTACC TAAAGGCCAC TGCCGCAAGC 
TTATTGATTA CCGCTGCCAC AGTAGCGTTC CCCTTGTTCT ATCTGGGGAT GCCGGCGGCA 
GTTGGGCAGC CCCATTGGCA ATTTTTTATT ATTAGTGCTG CCGGCGGCAG TGCAGGCTGG 
ATGGTGGCTG TAATTACGCT TCGTCATCCT ATTTGGGACG AGTTGAGACT TCTATTTTCC 
CAGGCTCGGA ATCGGTTATG GCCGGTTAGC AGTTAG

Protein sequence

MLESKTEPGV RHSIVVTTLN RYAVLVISLV STMVLARLLT PAEIGIFSMA VVFVNLAHSM 
RDFGVGRYIV QEKELTVDRI RSAFGITLGI AWSMAIVLAI AAPWVADFYG DERVTGILRV 
LAVNFVLIPF GSVVLSYLNR EMQFTTIFLV GVISEFVRAA SGIWFAWIGL GAMSLAWSAL 
LGVIATVVLA RILGPSHFIL RPAFCEWRRV MSFGGRATLA TIAFQFQRGA PEVVIGRYLS 
AAAVGFFSKA LGVIRLFDRT VLSAVSPAIL PHMAAKHRSG ESVAGFYAHG LGLITALAWP 
CYAFIAIMAF PVVRILFGDQ WDAAVPLARI LAIYAAVDAL YAFTAQALIA VGAVHLLVRL 
RVATLLATVL ALVLAVSYGL EVVAFAMVFP AVVGLIYSSL LMRSAIGLKG RVYLKATAAS 
LLITAATVAF PLFYLGMPAA VGQPHWQFFI ISAAGGSAGW MVAVITLRHP IWDELRLLFS 
QARNRLWPVS S