Gene Noc_2777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2777
Symbol
ID	3705507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3153557
End bp	3154639
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	52%
IMG OID	637739253
Product	histidinol-phosphate aminotransferase
Protein accession	YP_344754
Protein GI	77166229
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAG ACCGGGTTGC CCAATGGATT CGTCCCGAGA TACAGCGACT CTCTGCCTAT 
CGGGTCGCCG ATGCAGCGGA TTTAATCAAA TTGGATGCCA TGGAAAATCC CTATACTTGG 
TCGCCGGAAT TAATAGAGGC TTGGCTGGAG CGGTTGCGGC AAGTCAGCGT TAACCGTTAT 
CCAGACCCAC AGGCTCGCAG CCTCAAGCTT CGTCTCCGGC AGTATCTGGC CCTGCCGGAA 
GACATGGAGA TGATTTTGGG GAATGGTTCC GATGAACTGA TCCAGATGGT GTTACTGGCC 
GTGGCGGGGC CAGGGCGATC TGTGGTTGCG CCCGAGCCCA CTTTTGTCAT GTACCGGCAG 
ATTGCTGCTC TACTGGGGCT GCAATATCAG GGGGTAGCTC TGCGGGAGGA TTTTTCTTTA 
GACTTACCGG CAATGCTACA GGTTATTCGG GAGCGGGTGC CAGCAGTTGT CTTTATCGCT 
TATCCCAATA ATCCCACTGG TAATCTCTTT TCCGCTGAAG AATTGCAAGC CATTATTGAA 
GCTTCTCCTG GGCTTGTCAT CGTGGATGAA GCCTATAGCG TGTTTGCAGG TGAAACCTTC 
ATGCCCCGGT TGGAGGACTA CGATCATCTC CTGGTCATGC GAACGCTCTC TAAGATTGGC 
CTGGCAGGTC TCAGGTTAGG GATGTTGATG GGAAATCCAG CTTGGATCAA GGAGCTAGAG 
AAAGTACGGT TACCCTATAA TATTAACCAA TTAACCCAAG TCAGTGCCGA GTTTGCTTTG 
GAGCAGCCGG GGGGGTTAGA TGAACAGGCC CGGCTCATCT GCAAGGCCCG GGCGCAGCTG 
CAGAGGGCTT TGCAACAGTT ACCGGGGATT CAAGTTTATC CTAGCGATGC AAACTTTATT 
CTTTTCCGTA CTCCCCCCCA TCAGGCTGAG GCGATTTTTA CTGCCATTAA GGAACGGGGG 
GTCTTAATTA AGAACCTTTC CGGCCAGGGT GGCCTGTTAA CGGATTGCCT CCGGGTGACC 
GTAGGCACGG CAGATGAAAA TCACGCCTTT TTGAAAGCGC TAAAAGCTGG GCGAAAAAAC 
TGA

Protein sequence

MTKDRVAQWI RPEIQRLSAY RVADAADLIK LDAMENPYTW SPELIEAWLE RLRQVSVNRY 
PDPQARSLKL RLRQYLALPE DMEMILGNGS DELIQMVLLA VAGPGRSVVA PEPTFVMYRQ 
IAALLGLQYQ GVALREDFSL DLPAMLQVIR ERVPAVVFIA YPNNPTGNLF SAEELQAIIE 
ASPGLVIVDE AYSVFAGETF MPRLEDYDHL LVMRTLSKIG LAGLRLGMLM GNPAWIKELE 
KVRLPYNINQ LTQVSAEFAL EQPGGLDEQA RLICKARAQL QRALQQLPGI QVYPSDANFI 
LFRTPPHQAE AIFTAIKERG VLIKNLSGQG GLLTDCLRVT VGTADENHAF LKALKAGRKN