Gene Noc_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0037
Symbol
ID	3705970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	36273
End bp	37454
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	50%
IMG OID	637736561
Product	hypothetical protein
Protein accession	YP_342109
Protein GI	77163584
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCG TTCAAAAAGA TTTTTTTCCC CACCCTGAGC CGATAGCCTT GGCTCATAGC 
CAAAAATTGG AAAACGTGAT CCAAACGACC ATTGAGCAAG CAGGCGGCCA AATCCCCTTT 
GCTCGCTTTA TGGAACTAGC GCTTTATACG CCGGGTTTAG GTTATTACAT GGCGGGTCTC 
CATAAGCTAG GTACTTTCGG CGATTTTATT ACCGCTCCGG AGCTATCCCC TCTTTTTGCC 
CGCTGCATCT CTCGCCAATG TCAGCAGATA TTTGAGCTGC TTGGAACAGG CGATATTTTA 
GAATTTGGGG CTGGATCAGG CCGCCTAGCT GCGGATTTAC TTAGTGAACT AAACCTTAGC 
GGTAATCTAC CGGAACGGTA TTTTATCTTG GAACTTAGTG CCGATTTGCG TCATCGCCAA 
CAGGAAACAC TCTACCAGCG AGTACCCCTC CTCGCCTCAA GAGTAAGTTG GCTAGATCGA 
CTACCCGACA GAATTGACGG CTTTATTCTA GCTAATGAGG TGTGCGATGC CATGCCTACG 
CACTGCTTCC AGCTTGAAAA CGGGTACGAC TGGGAACGCT ACGTAGGCTA CGAGAAAGGC 
AAGTTTGTCT GGAAAAAAGG CCCTTTAAGT CATCCCCTCC TGAAAGATCG CATTGCCAAA 
ATACGCCTGC TTCTTAAACA TGTAAATAGC TACGAATCTG AAATTAATTT AGCTATGGAA 
GGCTGGACTA CTGAAATCGC CCATCGATTG CGGAAGGGGA TGCTCCTCAT CATTGACTAT 
GGCTTTCCTC GGCATGAGTA CTATCATCCA GAGCGAATGA TGGGCACTCT GATGTGCCAT 
TATCGCCACC AGGCCCATCC CAATCCACTA ATCATGGCGG GGTTACAAGA TATCACTACC 
CATGTGGATT TTACTGCTCT TGCCGAAGCA GGCCATAGTA GTGGGCTTAG GGTGGCCGGG 
TATTGTACGC AAGCCGATTT CTTGCTGGCC TGCGGTTTGG ATAAACTAGC TGCGACCGAA 
ATCGCAGCAG GGGAGAAGCA GGCTTTGGAA ACCAGCCAAC AGATCAAGCG CCTTGTTCTC 
CCCAGCGAGA TGGGTGAACT TTTTAAGGCC CTCGCCCTAA CCCGGGAAAT TAACCAGCCC 
CTATTAGGTT TTAATTTGCG GGATCGGCGG GCCCGCCTAT AA

Protein sequence

MRRVQKDFFP HPEPIALAHS QKLENVIQTT IEQAGGQIPF ARFMELALYT PGLGYYMAGL 
HKLGTFGDFI TAPELSPLFA RCISRQCQQI FELLGTGDIL EFGAGSGRLA ADLLSELNLS 
GNLPERYFIL ELSADLRHRQ QETLYQRVPL LASRVSWLDR LPDRIDGFIL ANEVCDAMPT 
HCFQLENGYD WERYVGYEKG KFVWKKGPLS HPLLKDRIAK IRLLLKHVNS YESEINLAME 
GWTTEIAHRL RKGMLLIIDY GFPRHEYYHP ERMMGTLMCH YRHQAHPNPL IMAGLQDITT 
HVDFTALAEA GHSSGLRVAG YCTQADFLLA CGLDKLAATE IAAGEKQALE TSQQIKRLVL 
PSEMGELFKA LALTREINQP LLGFNLRDRR ARL