Gene Veis_4374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4374
Symbol
ID	4693292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4825060
End bp	4826250
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	68%
IMG OID	639852123
Product	histidinol-phosphate aminotransferase
Protein accession	YP_999095
Protein GI	121611288
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.279737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.478615
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTTT GCAGCCCGCC ACGCTTGGCT GCTTGCCGCA CCCCGATTCA GCCCGCGCAC 
TGCAGACTCC CCCGAATGCC CGCTCCATCC CCGACCCCCC TGACCCATAT CCGCCCCGAT 
GTGCGCGCCA TGCGCGCATA CCATGTGCAG CCGGCCACCG GCATGCTCAA GATGGACGCG 
ATGGAAAACC CGTTCCGGCT GCCGGCCGAT CTGCAAACCG CGCTCGGCCA GCGCCTGGGC 
GCTCTGGCGC TCAACCGCTA CCCGAGCGAC GCGCGCCTGG CCGAGCTGCA GGCCGCGCTG 
GCGCGCTACG CCGGCCTGCC CGAAGGCCAT CGCATCATGC TCGGCAATGG CTCGGACGAA 
CTCATCGCGC TGCTGGCCCT GGCCTGCGCC CGGCCCGGCA GCGGCGAGCG CCCCGGCGTG 
CTGGCTCCGC TGCCCGGCTT TGTGATGTAT GCGTTGAGCG CGCAATTGCA GGGCCTGGAC 
TTCGTCGGCG TGCCGCTGAC GGCCGATTTC GAGCTGGACG AGCCGGCGAT GCTGGCCGCC 
ATCGCCCGGC ACCGGCCCGC GCTCACCTAC ATCGCCTACC CCAACAACCC CACGGCCACG 
CTGTGGGACG AAGGCGCGGT GCAGCGCATC ATCGACGCGG TCGGCACGCA GGGCGGCATC 
GTGGTGATGG ATGAAGCCTA TCAGCCCTTT GCCTGCCGTA GCTGGATCGG GCGCCTGCAC 
GCCGAACCCG GGCGCAATGC CCATGTGCTG CTGATGCGCA CGCTCAGCAA GTTCGGCCTG 
GCCGGTGTGC GCCTGGGCTA CCTGATCGGC CCGGCGGCCC TGGTCAACGA GATCGACAAG 
GTGCGCCCGC CCTACAACGT GAACCTGCTC AGTTGCGAAA CCGCGCTGTT TGCGCTCGAA 
CATGCCCCGG TGTTCGCCGC CCAGGCGGCC GAACTGCGCA CCCAGCGCGA CCTGCTGATC 
GGTGCGCTGC GCCAGTTGCC CGGCATCGCA AAATGCTGGG ACAGCCAGGC CAACATGGTG 
CTGGTGCGGG TGGCCGATGC CAGCCGCACC TACGAGGGCA TGAAAACCCT GAAGGTCTTG 
GTCCGGAACG TTTCTACAAT GCACCCCTTG CTGAGCAACT GCCTGCGCCT GACGGTCGGC 
AGTGCCGACG ACAACGCACA AATGCTGGCT GCACTCCAGG CCTCTTCATG A

Protein sequence

MAFCSPPRLA ACRTPIQPAH CRLPRMPAPS PTPLTHIRPD VRAMRAYHVQ PATGMLKMDA 
MENPFRLPAD LQTALGQRLG ALALNRYPSD ARLAELQAAL ARYAGLPEGH RIMLGNGSDE 
LIALLALACA RPGSGERPGV LAPLPGFVMY ALSAQLQGLD FVGVPLTADF ELDEPAMLAA 
IARHRPALTY IAYPNNPTAT LWDEGAVQRI IDAVGTQGGI VVMDEAYQPF ACRSWIGRLH 
AEPGRNAHVL LMRTLSKFGL AGVRLGYLIG PAALVNEIDK VRPPYNVNLL SCETALFALE 
HAPVFAAQAA ELRTQRDLLI GALRQLPGIA KCWDSQANMV LVRVADASRT YEGMKTLKVL 
VRNVSTMHPL LSNCLRLTVG SADDNAQMLA ALQASS