Gene Noc_2734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2734
Symbol
ID	3705370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3104405
End bp	3105589
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	53%
IMG OID	637739216
Product	glycoside hydrolase family protein
Protein accession	YP_344717
Protein GI	77166192
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1449] Alpha-amylase/alpha-mannosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATTA TCCACCACGC CCTTGTCTTA AACTTACATC AACCAGCAGG CAATCTGGAG 
CATTTACTGG AACATGCCCC CTGGGAGGCT CAAGAAATTC TCTATGCCCT GGACCGGATA 
CCCCGCTCCC TTTGGGGATA CGAGGATATC GCCCGGGTTC ATCTAGCCTT CTCGGGTACG 
CTCCTTGAAA CCCTCTCCAA TCCCGGCTTT CAGCAACGGG TCTATGGGAT TATCAAATGC 
GGCGACTTGC TGTGGCATCT CCAGAATACC GCCTTATTTA ACCTTCTGGG GAGCGCTTAC 
TATCACCCTG CTCTCCCCCT GATTCCTGGC CCGGATCGGG AAGAGCATAT CAAGCGCTGG 
CTAGGTATCG GGCGGCATCT TTTTAGCCAA ACTCGCTTCA GCGGGTTTTG GCCGCCAGAG 
ATGGCTTTTA CCATGGAATT GATCCCCCTG CTGAAGCAAC ATGGGTTCCG TTATGTCCTG 
GTAGATAGCC TCCATGTGGA GCCTTTAGAG GAGATGAGTT GGCAGGAGCT CCGCTACCGC 
CCCCATATTG CCGAGTACGG GGGGGAAGAA ATCATTGTGG TGGTCCGGGA CCGGGAACTC 
TCAGATGCCC AGGAAGCCGG AATGGAGTAT GACTGGTTTC TAAATGAGCT TTATCACCGC 
ACCCGGCCGT GTGACTTCCC GCCCCTGGTT ACCACCTGTA GCGATGGAGA CAATGGCGGC 
TGGTTCCGTA ATACTTCCGA GGAAAGTAAT TTTTGGGGAA CATTTTACCG GGATTTTTTA 
ACAGGGGCGC GCCGGGATAA TGCTATTCTC CGCCCCGCTT TCATCCAGGA TTACCTGGAC 
AAATACGGCG CCAAGGGCCG AGTTAGGATA ACAACCGCAG CCTGGAATAC TGGCGATCAC 
TCAGGGATTG ATTTTATCCA GTGGACCGGC TCCCAGTGCC AAAAAGAGGC CCTTAAACGG 
GTAGAAGAAA CCAGTACGGC CTTCCATCAA CTAAAGCAAA AACATCTTGG CGCTCAAGCC 
CTGAACCCGG AAATCGCCCA TCTTCTCAAT GAGGCGGAGT GGCACCTGCT ACGCTCGGAA 
ACCAGTTGCC ACTTTTATTG GGGAGAAGCA TGGGTTCATC GCGCCCATGA AGATTTGGAT 
ACCGCCTGGA CGCAAATGAA CACCGCAGCC CAGAAACTTA AATAA

Protein sequence

MSIIHHALVL NLHQPAGNLE HLLEHAPWEA QEILYALDRI PRSLWGYEDI ARVHLAFSGT 
LLETLSNPGF QQRVYGIIKC GDLLWHLQNT ALFNLLGSAY YHPALPLIPG PDREEHIKRW 
LGIGRHLFSQ TRFSGFWPPE MAFTMELIPL LKQHGFRYVL VDSLHVEPLE EMSWQELRYR 
PHIAEYGGEE IIVVVRDREL SDAQEAGMEY DWFLNELYHR TRPCDFPPLV TTCSDGDNGG 
WFRNTSEESN FWGTFYRDFL TGARRDNAIL RPAFIQDYLD KYGAKGRVRI TTAAWNTGDH 
SGIDFIQWTG SQCQKEALKR VEETSTAFHQ LKQKHLGAQA LNPEIAHLLN EAEWHLLRSE 
TSCHFYWGEA WVHRAHEDLD TAWTQMNTAA QKLK