Gene Caul_3228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3228
Symbol
ID	5900683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3487393
End bp	3488520
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	69%
IMG OID	641563733
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001684853
Protein GI	167647190
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.207883
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTTC CGACCACCGA CCGTTTCGCC GCGCCGCGCC CCATGCCCAA GCCGGGCGTC 
CTCGACATCG CCGCCTATGT GGGCGGAAAG TCGAAGGTGG AAGGGATCGC CCATCCGGTG 
AAGCTGTCGA GCAACGAGAA CGTCCTGGGC AGCAGCGACA AGGCCAAGGC CGCCTATCGC 
GACGCGGTCG ATCGCCTGCA CATCTATCCC GACGGCAAGG GAACGGCCCT GCGCGCCGCC 
ATCGCCGCCC ACTATCGCCT CGAGGTCGAG CGCATCACCC TGGGCGACGG CTCGGACGAG 
ATCTTCGCCC TGCTCAACCA GGTCTATCTT GAGCCGGGCG ACAACATCGT CCAGGGCGAG 
CACGGCTTCG CCGCCTACGC CATCGGAGCC CGAGCCTGTC AGGGCGAGGT CCGCTTCGCC 
AAGGAGCCGG GCCGGCGCAT CGACATCGAC GAGGTGGTCA AGTGCGTCGA TGAGCGCACC 
CGCCTGGTGT TCATCGCCAA CCCCGCCAAT CCGACCGGCA CCTGGCTGAC CGGCGAGGAG 
ATCCGCGCCC TGCACGCCGC CCTGCCGCCG TCGGTGGTGC TGGTGCTGGA CGGCGCCTAT 
GCCGAGTTCT GCACCGATCC GCGCTTCGAG GACGGGCTGG ACCTGGCGCG GACCGCCGAG 
AACGTCATCG TCACCCGCAC CTTCTCCAAG CTCCACGGCC TGGCCGCCCT GCGGGTGGGC 
TGGGGCTATG GTCCGGCGGG GATCATCGAA CCGCTGGAAC GCATCCGTCC GCCGTTCAAC 
ACCTCGATCC CGGCCCAGGA CGCGGCCATC GCCGCCCTGG CCGACGAGGA GTTCCAGAAG 
CGCTCGGTCG CCCTGGTCGA ACAGTGGCGG CCATGGCTGA CCCAGCAGAT CGGCGGCCTG 
GGCCTGGAGG TCACTCCGTC GGCGGCCAAT TTCGTGCTGA TCAACTTCCC CGACGTCGCG 
GGCAAGACGG CCCGCGAGGC CGAGGCCTTC CTGGCGTCGC GGGGCTATCT GGTCCGCGCC 
GTGGGCAATT ACGGCCTGCC GAACGCCATC CGGGTCACCG TGGGACTGGA AGAGCAGAAC 
CGGGCCGTGG TCGAACTGCT GGCCGAGTTC CTGGGGCGAA AAGTATGA

Protein sequence

MTVPTTDRFA APRPMPKPGV LDIAAYVGGK SKVEGIAHPV KLSSNENVLG SSDKAKAAYR 
DAVDRLHIYP DGKGTALRAA IAAHYRLEVE RITLGDGSDE IFALLNQVYL EPGDNIVQGE 
HGFAAYAIGA RACQGEVRFA KEPGRRIDID EVVKCVDERT RLVFIANPAN PTGTWLTGEE 
IRALHAALPP SVVLVLDGAY AEFCTDPRFE DGLDLARTAE NVIVTRTFSK LHGLAALRVG 
WGYGPAGIIE PLERIRPPFN TSIPAQDAAI AALADEEFQK RSVALVEQWR PWLTQQIGGL 
GLEVTPSAAN FVLINFPDVA GKTAREAEAF LASRGYLVRA VGNYGLPNAI RVTVGLEEQN 
RAVVELLAEF LGRKV