Gene VIBHAR_02074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_02074
Symbol
ID	5554421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	-
Start bp	2072888
End bp	2073925
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	49%
IMG OID	640907561
Product	formimidoylglutamase
Protein accession	YP_001445266
Protein GI	156974359
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCTCA CGGAGGACTT TAACATGGCT CAATCAGACC CAAATACCGC TCCATTTCAC 
TGGCAAGGTC GCCACGATGC AGAAGATGGA GAACTGGGTA AGCGCGTTCA CCACGTGATT 
AAAAATATTT CGGTTGAAGA GTTACCGAGC AAAAGCGAAG GCGTCTCAAT ACTTGGTTTT 
GCGACCGACG CGGGTGTTGC TAGAAATAAA GGCCGTATTG GCGCAAAAAA GGCACCGGAT 
TTAATCCGTC GTGCCCTAGC CAATCTCGCT TGGCACCAAG ATGCACCGCT TTATGACCTC 
GGTACTGTCG TTTGCGAAGA CGACCTACTA GAGAGCAGCC AATCGCAATG CGCAGCGACG 
GTTGCTCAAG CTCTACCCCA TTCACCTGTC GTAGTATTAG GCGGCGGGCA TGAGATCGCA 
TGGGCGTCAT TTTCAGGGTT AGCCGAGTAC TTCAAAACCC ATCACCCAGA AAAGCAGCCG 
AAGATTGGCA TTATCAACTT CGACGCACAC TTCGACCTAC GCGCTTTTGA AAGTTCGCTG 
GCAGATGTAA AACCGAGCTC AGGCACACCA TTTAATCAGA TTCATCACTT CTGCCAACGC 
AATGATTGGA AGTTTCATTA CGCTTGCATT GGCGTCAGTC GCAGCAGCAA TACCAAAGCG 
CTATTCCAGA AAGCGGACGA ACTCAATGTT TGGTATATGG AAGACAAACA GCTTTGCTAC 
ATGAATCACA GCTACCATTT AACGCAGCTA CAGCACTTTA TCGATCACTG CGATTACCTC 
TATCTGACGA TTGATTTGGA CGTGTTCCCT GCGGCCACAG CTCCGGGTGT AAGCGCTCCA 
GCACCAAGAG GGGTCAGCTA CGACATCATT TCACCGTTTC TCGACCGAAT CCTACATTAC 
AAAAACAAGC TCATGCTGGC AGACATTGCC GAGTATAACC CTACCTATGA CGTCGATAGC 
CAAACCGCTC GATTGGCAGC CCGCCTATGT TGGGACATCG CCAATGCCAT GGCAGAGAAA 
GACCATAAAC CAAAATAA

Protein sequence

MSLTEDFNMA QSDPNTAPFH WQGRHDAEDG ELGKRVHHVI KNISVEELPS KSEGVSILGF 
ATDAGVARNK GRIGAKKAPD LIRRALANLA WHQDAPLYDL GTVVCEDDLL ESSQSQCAAT 
VAQALPHSPV VVLGGGHEIA WASFSGLAEY FKTHHPEKQP KIGIINFDAH FDLRAFESSL 
ADVKPSSGTP FNQIHHFCQR NDWKFHYACI GVSRSSNTKA LFQKADELNV WYMEDKQLCY 
MNHSYHLTQL QHFIDHCDYL YLTIDLDVFP AATAPGVSAP APRGVSYDII SPFLDRILHY 
KNKLMLADIA EYNPTYDVDS QTARLAARLC WDIANAMAEK DHKPK