Gene Noc_2943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2943
Symbol
ID	3706425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3330777
End bp	3331817
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	53%
IMG OID	637739420
Product	choloylglycine hydrolase
Protein accession	YP_344918
Protein GI	77166393
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGAC AGATGATTTA CCGAACCGTG GCAAGTGCAG CTATTTTCGT GGTTGTGGGA 
CTTGTTTTCT TGCAGGCCGC CGATGCCTGT ACGCGTGTTC TTTGGAACGA CAGCGGGCTG 
AACGTCGTGG TGGGGAGGAC GATGGACTGG CCGGAGTCTA CCCAGCCGGA GATCGTGGTC 
TTTCCACGTG GAATGAAACG GGATGGGGGC CTCCTCGGTA CGGAGACTGC GGTCAAGGTG 
AATCCAGCCA AGTGGACATC CAAATATGCC AGTATGGTGG TCCCAGTTTA CGGCATTGGC 
ACCGCTGACG GCTTTAATGA AGCCGGGCTA GCAATTCACA TGCTGTACCT CGAAAATACG 
GATTTTGGGC CACGCGATCC CAGCAAGCCG GGTGTACAGG CTGGTCTATG GGGGCAGTAT 
GCACTGGACA ATGGGGCGAC AGTTGATCAA GCATTGCCCC TGCTCAAGAA GATCCAGCCG 
GTGATGGTCG AGATGCACGG ACACAAGGCC ACGGTTCACC TGGCCTTGGA AGATGCCACG 
GGTGATTCTG CTATCCTCGA GTACATTAAC GGCAAGCTGG TCATTCATCA TGGCCGTCAA 
TATCGGGTCA TGACCAACGA TCCAAGCTAT GATCAGCAAC TCGCGTTGCT GCAGAAGATG 
AAAAAAGAGG TTGATTTCAC GCATCCAAGC AGTAACACCC CGTTACCCGG CAATGTCAGT 
GCTACGGATC GTTTCCAGCG GGCGTCTTAT TTCTCGGCAT TGTTACCCAA GCCGAAGGAC 
GAACGCGAGG AAGTCGCTTC TATACTGTCC ATTATGCGCA ACGTATCGGT GCCATTTGGT 
GCACCCTACC AGAGCTTTGG TATCTACAAT ACTGAGTACC GTACGGTGAC CGATCTCGAC 
ACTAAGCGCT ACTATTTTGA ATTGACGACT GCACCGAATG TGATCTGGGC AGATCTTACG 
AAATTTGACC TGAAACCCAG GTGCACCGGT AATGGTGCTA AATCCGGACA ATATCGGCCT 
GAGTGGGAAT GTCACGGATA G

Protein sequence

MNRQMIYRTV ASAAIFVVVG LVFLQAADAC TRVLWNDSGL NVVVGRTMDW PESTQPEIVV 
FPRGMKRDGG LLGTETAVKV NPAKWTSKYA SMVVPVYGIG TADGFNEAGL AIHMLYLENT 
DFGPRDPSKP GVQAGLWGQY ALDNGATVDQ ALPLLKKIQP VMVEMHGHKA TVHLALEDAT 
GDSAILEYIN GKLVIHHGRQ YRVMTNDPSY DQQLALLQKM KKEVDFTHPS SNTPLPGNVS 
ATDRFQRASY FSALLPKPKD EREEVASILS IMRNVSVPFG APYQSFGIYN TEYRTVTDLD 
TKRYYFELTT APNVIWADLT KFDLKPRCTG NGAKSGQYRP EWECHG