Gene Bpro_5333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_5333
Symbol
ID	4016292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007950
Strand	+
Start bp	93113
End bp	94414
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	64%
IMG OID	637944955
Product	homoserine dehydrogenase
Protein accession	YP_552087
Protein GI	91791137
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.767379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAG GGATATTAGG TTTTGGCAAC GTTGCCGCAG CAACGATCGA GGCCTTCACC 
ACCAATCAGG ATCTCATCCG ATCCAAGACG GAAACCCCCA TCGAGTTCGT GCGGGTTGCC 
ACGCGCACGC CTTCACGCGC GCAGGGGCGC GTGCCTGGCG GCTGCGTCGT GTCCGATGAC 
TGCTGGGCAG TGGTGGACGA TCCTCAGATC GACGTGGTCC TCGAACTCAT GGGCAACGTG 
AAGCTGGGGC GTGAGCTCGT ACTCCGGGCC TTGTCCAACA GCAAGCACGT CATCACGGCC 
AACAAGGCAC TCCTGGCCCA ACACGGCGAG GAGATCATGC AGATGGCGGA TCAAGCCGGG 
TGCAGCGTGC TCTTCGAGGG TGCCGTGGCT GTTTCGATCC CCATCATCAA AACGCTCCGC 
GAGTCGGCGG CCGCCAACCG GATCTCGTCC ATCATCGGCA TCCTGAACGG CACGTCGAAC 
TACGTGCTGT CCCAGATGAG CGAGCACGGC GTCGACTTCG CGACCGCTGT CGCCGACGCG 
CAGCGCAAGG GCTACGCGGA AGCAGACCCC ACGCTGGACG TGAATGGCGA GGATGCGGCG 
CACAAGCTCA CGCTCCTGGC TTCGCTCGCC TTCGACGTAC CCATCAACTT CAGTGCGGTC 
GAGTTCAAGG GTATTGCGGA GATCGACCAG GTCGACATCG AATTCGCCAA GCGACTCGCC 
CACCAGGTCA AACTGATCGC GCAGGCCAGA CTGGAGTCGG GTGGCATAGC CATCAGCGTG 
CAGCCCACCC TGGTGCCCGA CCGGTCGATG CTGGCGCGGG TCGGCGGCTC AATGAACGGC 
ATCTCCCTGC AGGGTGACCT GCTGGGTCCG GCCTTCCTCT ACGGCTCGGG TGCCGGGGGC 
CGGCAGACCT CCAGTGCCGT GCTGGCCGAC CTGCTTGAGC TGGCCAATCG CGGCGGTCCG 
AACGGTGCGG GCGGCGGCCA CAACATGGGG TTCCGGCCTC GTGGGACCGG GCAGACCGAG 
GTCCGCTACT GCAACGATCG CGTCGGTGCG TTCTACATCC GGCTGCGCCT GGACGACAAG 
GCCGGCGCGC TGGCCAAGGT CAGCACGGTC CTAGCTGATG CCAACGTGTC GATCAACTCG 
CTGCTGCAAG ATCAGGGACT CGATGGGTTG TCGGACCTGA TCGTGATCAC GCACGACATC 
TCTAGCGGCC AACTCCGAGA TATGTTGCCC TATCTCCAAC AGGCTGCAGG CCCTGGCCAC 
ACGGTCGTGA TCTATCCAGT TCTGGGTGAC TGCGGATGCT GA

Protein sequence

MKVGILGFGN VAAATIEAFT TNQDLIRSKT ETPIEFVRVA TRTPSRAQGR VPGGCVVSDD 
CWAVVDDPQI DVVLELMGNV KLGRELVLRA LSNSKHVITA NKALLAQHGE EIMQMADQAG 
CSVLFEGAVA VSIPIIKTLR ESAAANRISS IIGILNGTSN YVLSQMSEHG VDFATAVADA 
QRKGYAEADP TLDVNGEDAA HKLTLLASLA FDVPINFSAV EFKGIAEIDQ VDIEFAKRLA 
HQVKLIAQAR LESGGIAISV QPTLVPDRSM LARVGGSMNG ISLQGDLLGP AFLYGSGAGG 
RQTSSAVLAD LLELANRGGP NGAGGGHNMG FRPRGTGQTE VRYCNDRVGA FYIRLRLDDK 
AGALAKVSTV LADANVSINS LLQDQGLDGL SDLIVITHDI SSGQLRDMLP YLQQAAGPGH 
TVVIYPVLGD CGC