Gene Noc_2005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2005
Symbol
ID	3705195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2312510
End bp	2313757
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	48%
IMG OID	637738482
Product	hypothetical protein
Protein accession	YP_343997
Protein GI	77165472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.87614
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTA CTGCGATAAG CAAAAAAACC CGTCTCCATC CATGGCTGAG ATGCCTGCTA 
TTTCTGACCA CCGCAGGCGG TGTACAAGCA GAAGATTTTA GAGAAACCAC AGGACTTTTC 
GATGCCTTAA CCGGCATCAA TATCAATGAA ACAAAATTCA TGCAGTCACT AGGAGTAACG 
ATTAATGGCT GGCTAGAAGG CGGCTATACT ATCAATCCAG ACGATCCCCG TGATAACTTC 
AATGGACCCG TTACCTTTAA TGACCGTGCC AACGAATTCA TGGGAAACGA AGCCTATTTG 
TTCTTTGAAC GCGGCGTGAA TGTCGAGGGC GATCGCTGGG ACTTTGGCGG GCGGGTCGAT 
TTTCTTTTTG GTACCGATGC CCGTTTCACC CAGGCAGCGG GCCTAGATGA CAACATCATC 
GGTGATGATA CTTTTCGCTT CTACAAATTT GCTATCCCGC AACTATACGT GGAAGCCTAT 
GCTCCCTATG GCAACGGCAT CACGGTAAAG CTTGGTCATT TTTATACTAT CATCGGTAAT 
GAAGTCGTGA CGGCCCCCGG TAACTTCTTC TATTCCCATG CCTATACGAT GCAGTATGGC 
GAACCCTTCA CCCATACTGG TTTTCTAGCC AGTTACCCCT TGACCGATAA TATTAGCATC 
AATGGTGGCG GCGTTCTCGG TTGGGACAAT TTTTCCAAAG ATGCTGAAAA TCTTAATTTC 
TTAGGCGGGG TAAGCTGGAG CAGTGATGAT GCGCGAACCT CCTTGGCTGT CGCCATCATC 
ACGGGCGATG TCTCTGATGT GGGGGGAACC CCAGATGATC CTGATAACAA TCGCACCCTC 
TATAGCGTGG TCTTCAACCA CGACTTCACT GATCGGCTTC ACTATACTTT TCAGCACGAT 
CTAGGCATAG AACAGCGTGC CATTAATAAC AACAAATCGG CGGAATGGTT TGGCATCAAT 
CAATATTTAT TTTATGATAT CAATGAAACT GTAAGCACGG GTTTACGGTT CGAGTGGTTC 
CGCGATGACG ACGGCACCCG TGTCTTTGTC AATGATAGCT CCGGTCTCCC GGTTTCCGCC 
GCCGCAAATT ATTTTGCCAT CACCGGCGGC TTGAACTGGC GACCATTAAG ATGGGTCACC 
GTTCGTCCAG AAGTACGTTA TGACTGGGCC ACCAATTTCG AGGCTTTTGA TAATAACAGC 
GATAAGAATC AATTTGTTGT CGCTGCGGAC ATTATCGTTC AATTCTAA

Protein sequence

MNTTAISKKT RLHPWLRCLL FLTTAGGVQA EDFRETTGLF DALTGININE TKFMQSLGVT 
INGWLEGGYT INPDDPRDNF NGPVTFNDRA NEFMGNEAYL FFERGVNVEG DRWDFGGRVD 
FLFGTDARFT QAAGLDDNII GDDTFRFYKF AIPQLYVEAY APYGNGITVK LGHFYTIIGN 
EVVTAPGNFF YSHAYTMQYG EPFTHTGFLA SYPLTDNISI NGGGVLGWDN FSKDAENLNF 
LGGVSWSSDD ARTSLAVAII TGDVSDVGGT PDDPDNNRTL YSVVFNHDFT DRLHYTFQHD 
LGIEQRAINN NKSAEWFGIN QYLFYDINET VSTGLRFEWF RDDDGTRVFV NDSSGLPVSA 
AANYFAITGG LNWRPLRWVT VRPEVRYDWA TNFEAFDNNS DKNQFVVAAD IIVQF