Gene Noc_2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2088
Symbol
ID	3704948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2398025
End bp	2399152
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	51%
IMG OID	637738563
Product	H+-transporting two-sector ATPase, C (AC39) subunit
Protein accession	YP_344078
Protein GI	77165553
COG category	[C] Energy production and conversion
COG ID	[COG1527] Archaeal/vacuolar-type H+-ATPase subunit C
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.295713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCGTC CTTTTTTAAC TATCACCAAG AGCCCTTCCA TAGCCACCGT TACCCGCTAT 
GCTTATTTGA ATACCTTGGT CTCGGCTCTC TCCAAGCGTC TCCTGTCAGC AGAACAGCTC 
CGGAATCTGG TGGACCAATC GGCCTCGGAT GTTTCGGTTT TACTTCGTAC CGCCGGGTTG 
ACGGGGATTT CTCTGCAAGC AATGGAGGAT CGTTCTTTAG AGCAAGTGCT GGTGGATACC 
TTATGGGCGG AAGCCCAACG GCTGATTCGT CCTCTGAGCG CTGAAGCCCA GGAACTCGCA 
AGCTATTGGC TACGCCGTTT TGAGATAGGT AACCTGAAAA TTGTGCTCCG GGGTAAGTTG 
ACTGGACGTC CAAAGGAGGC CATCCAAGCC GATCTTATTA AGATTAATGG AATAGCGGCC 
TTGCCCTTGA ACTCGTTGAT GGAGGCCGAG GATGCTCAGG AGGTGCTCCA TTGTTTAGAG 
GGAACACCCT ATGCTGGTGT TGCCCGCCAG GCCCGTTCGG TCTATGGAGG AGAGCATTAT 
GATGTGCCTC ATGTCGGAGG AGAGGGTCGA GAATTGTTTC TTATCGAAGC CACAATAGAT 
AGGGAATACT ATAGTGGATT GGCGCGGCGA GTAAATGCTA TCCAGGAAGA ACGGGACCGC 
CATTATTTGC GAATATTGAT CGGTTATCTC ATCGACCAAA CCAACTTGGT CTGGTTATTG 
CGCTACCGGT TTGCTTACCG TCTTGGGCCA CCGCTGACCT ATTTTCTTTT ATGCCCCGGT 
GGGTATCATT TGCGTAGTCA GCACTTGCTG GCCCTCGCGC GTGGGGAAAA CTTCGAGGAG 
ACTTTACACA ATCTACCTGC TCCTTTAGCC CCTTTGGTAG CAGGGGCAGT TTCCACTTCC 
GAGGTGGAGG AGATGCTAGG AAAACACTTA CTCGAAGTCG CGCAGTTTAT CCTGAAACGC 
ACCACTTTTA ATTTGGGACG GGCCTTCGCT TATCTATTTC TTCGTGAAAA AGAATTATTA 
CGCATCCATG GGATCATCAA GGGCCGCACT TTGCAGCTCG CCCCCCATCT TATTCACCAG 
GCCATGGGAC TGGAAAGTGC CGGTTTCAAG GAGGATGAGT CTTTTTAG

Protein sequence

MHRPFLTITK SPSIATVTRY AYLNTLVSAL SKRLLSAEQL RNLVDQSASD VSVLLRTAGL 
TGISLQAMED RSLEQVLVDT LWAEAQRLIR PLSAEAQELA SYWLRRFEIG NLKIVLRGKL 
TGRPKEAIQA DLIKINGIAA LPLNSLMEAE DAQEVLHCLE GTPYAGVARQ ARSVYGGEHY 
DVPHVGGEGR ELFLIEATID REYYSGLARR VNAIQEERDR HYLRILIGYL IDQTNLVWLL 
RYRFAYRLGP PLTYFLLCPG GYHLRSQHLL ALARGENFEE TLHNLPAPLA PLVAGAVSTS 
EVEEMLGKHL LEVAQFILKR TTFNLGRAFA YLFLREKELL RIHGIIKGRT LQLAPHLIHQ 
AMGLESAGFK EDESF