Gene Caul_3015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3015
Symbol
ID	5900470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3282712
End bp	3284001
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	70%
IMG OID	641563516
Product	homoserine dehydrogenase
Protein accession	YP_001684640
Protein GI	167646977
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.330452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA AAACCTGGCG CGTCGGAGTC GCCGGCCTCG GCACAGTCGG CGGGGGTCTG 
CTGCAGTTCC TGGCCGAGCA GCCGGACTTC GCCCCGGCCG GCGACCGGGC GGTGGTGACG 
GCGGTCTCGG CGCGTTCGAA GTCGCGGCCG CGCACGATCG ACATCTCGGG CCTGACCTGG 
TTCGACGATC CGGTGGCCCT GGCCTCGTCG CCGGACGTGG ACCTGTTCGT CGAGCTGGTC 
GGCGGCAGCG ACGGCCCGGC AAAAGCGGCT GTCGAAGCCG CCTTGAAGCT GGGCAAGCCG 
GTGGTCACCG CCAACAAGGC CCTGATCGCC GAGCACGGCG CCGAACTGGC CGCCCTGGCC 
GAGGCCAACA ACGCCCCGCT GCTGTTCGAA GCCGCCGTGA TGGGCGGCAC GCCGGCGGTG 
AAGATGCTGC GCGAGGCCAT GGTCGGCGAC GAGGTGGTCG GGGTGGCAGG CATCCTCAAC 
GGCACCTGCA ACTTCATCCT CAGCGAGATG GAGAAGACGG GCCGCGCGTT CGCTGACGTG 
CTGCGCGAGG CGCAAGGGTT GGGCTACGCC GAGGCCGACC CGACCATGGA CGTCGGCGGC 
TTCGACGCCG GCCACAAGAT CAGCATCCTG GCGGCCCTGG CCTTTGGTTG CGCGCCAGAC 
TTCGGCGCGG CCGAAATCGA GGGCATCAGC GACGTCGAGC TGCTCGACAT CAAGCTGGCC 
AAGGACCTGG GCTATCGCAT CAAGCTGGTG GCCGGGGCCG CCAAGACCGA CGACGGCGTG 
TCGGTGAAGG TGCATCCGTC CCTGGTGCCG CTGGAGCATC CGCTGGCCCA GGCCGGCGGG 
GCGCTCAACG CCCTGTTCAT CGAGGGCAAG CGGATAGGCC GGATCTACAT CCAGGGGCCT 
GGCGCGGGCG CGGGACCGAC CGCCGCCGCC GTGGCCGCCG ACATCGCCGA CGTGATGACC 
GGCGCCAAGC GCCCGGTGTT CCAGGCCCCG GCCGGCCAGC TGAAGCCGTT CGTCGCCGTC 
GATCCGGCCC GTTCGGTGGG CAAGGCCTAT CTGCGGATCA TGGTCCGCGA CGAGCCGGGC 
GCCATCGCCG CCATCTCCGA GACCCTGGCC GAATGCGCCG TCTCGATCGA CAGCTTCCTG 
CAAAAGCCCG TCGAGGGGGC GGGCGGCGTG CCGATCGTGC TCGTCACCCA TGCGACTCCC 
GAATCCAATC TGCTGGATGC GATTAGCCGC ATCGAAAAAC TGCACGCCGT GCTAGAGCGT 
CCCCGCCTTT TGCGCGTCGC GCGCATCTGA

Protein sequence

MTQKTWRVGV AGLGTVGGGL LQFLAEQPDF APAGDRAVVT AVSARSKSRP RTIDISGLTW 
FDDPVALASS PDVDLFVELV GGSDGPAKAA VEAALKLGKP VVTANKALIA EHGAELAALA 
EANNAPLLFE AAVMGGTPAV KMLREAMVGD EVVGVAGILN GTCNFILSEM EKTGRAFADV 
LREAQGLGYA EADPTMDVGG FDAGHKISIL AALAFGCAPD FGAAEIEGIS DVELLDIKLA 
KDLGYRIKLV AGAAKTDDGV SVKVHPSLVP LEHPLAQAGG ALNALFIEGK RIGRIYIQGP 
GAGAGPTAAA VAADIADVMT GAKRPVFQAP AGQLKPFVAV DPARSVGKAY LRIMVRDEPG 
AIAAISETLA ECAVSIDSFL QKPVEGAGGV PIVLVTHATP ESNLLDAISR IEKLHAVLER 
PRLLRVARI