Gene Veis_3649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3649
Symbol
ID	4692375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4035155
End bp	4036588
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	71%
IMG OID	639851404
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_998383
Protein GI	121610576
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0243931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCTG AGCAGACCGC GCAGCGCAGC CTGTTTGCGG CACAGGCCCT GCTGCCCGGC 
GGCTGGGCGC GCAACGTGCT CGTGCAATGG GATGCGGCCG GGCGCATCAC CGGCGTGGAC 
ACCGATGCCA GGGCGCCGGC CGGCCGGCCC GTGGCCGCAG GGCCGCTGCT GCCGGGCCTG 
CCGAACCTGC ACTCGCATGC CTTCCAGCGC GCGTTCGCCG GCCTGGCCGA ATACCGCGCC 
GAACGCCAGG ACAGCTTCTG GAGTTGGCGC CAACTGATGT ACCGCTTTGC AGCGCACATC 
ACACCCGGGC AGATGCAAGC CATCGCCACC TGGCTCTACG TGGAGATGCT GGAGGCCGGC 
TACACCCGGG TGTGCGAGTT CCACTACCTG CACCACGACC ACACTGGCCA GCCCTATGCC 
GACGACGCCC GGATGTCGCT GGCGCTGCTG CACGCCGCGC GCACGGCCGG CATCGGCATC 
ACACTGCTGC CGGCGCTGTA CCAAAGCAGC GGATTTGGCG CCCGGCCGCC GCACGCGCAG 
CAAGCGCGCT TCATCCGCAG CACCGCCAGC ATGCTCTCGT TATTGGAGCG CCTGAGGCCC 
ATCGCACAAG CGCAGGGCGC TGTGCTGGGC CTGGCTTTGC ATTCGCTGCG CGCGGTGCCG 
CCGGACAGCC TGCAGGCCGC CGTGCAGGGC ATCACGGCGC TGGACCCCCA GGCCCCGATC 
CACATCCACA TCGCCGAGCA GCAGCAAGAA GTCGACGACT GCATCGCCTG GAGCGGACAG 
CGCCCGGTGC AATGGCTGCT CGATCACGCC CCGGTGGACG CACGCTGGTG CCTGGTGCAC 
GCCACCCGGA TGACGCCCGA CGAACATGCC GCCGCCGCGC GCACCGGCGC CGTGGTCGGC 
CTGTGCCCCA GCACCGAGGC CAACCTGGGC GACGGCATCT TCGACCTGCC GCTGTGGTTG 
CAGCATGGCG GCCGCTGGGG CCTGGGCTCG GACAGCCATA TCTGCGTGAA TGCGGCCGAA 
GAACTACTGC TGCTCGAATA CGGCCAGCGC CTGTCGCGCC GCCAGCGCAA CGTGCTGGCC 
CATGCCACGC AGCCCGAAGT AGCCACCGCG ATGAGCTTGC AGGCCGTGCA GGGCGGCGCA 
CAGGCCGCCG GGCACGGCAT CGGTGCGGGC CTGGCAGGCA TCGCCGTCGG CCGGCAGGCC 
GACCTGGTGG TGCTCGACGC GCAGCATCTG GCGCTGCGCG GCCTGCCCGC GCACAGCATG 
CTCTCGGCCC ATGTATTCGG CAGCCAGCGC AGTTCAGCCC TGGACAGCCT GTGGGTGGCC 
GGCGTGCGCC GCGTCACCCA AGGCCGGCAC GCGCTGCACG AGGCGGCGGC CCAGGACTTC 
ATCGCCGCCC GCAGCGCCAT CATTGCGGCG CAACGCGCCG GAGCGATCCG CTAA

Protein sequence

MAPEQTAQRS LFAAQALLPG GWARNVLVQW DAAGRITGVD TDARAPAGRP VAAGPLLPGL 
PNLHSHAFQR AFAGLAEYRA ERQDSFWSWR QLMYRFAAHI TPGQMQAIAT WLYVEMLEAG 
YTRVCEFHYL HHDHTGQPYA DDARMSLALL HAARTAGIGI TLLPALYQSS GFGARPPHAQ 
QARFIRSTAS MLSLLERLRP IAQAQGAVLG LALHSLRAVP PDSLQAAVQG ITALDPQAPI 
HIHIAEQQQE VDDCIAWSGQ RPVQWLLDHA PVDARWCLVH ATRMTPDEHA AAARTGAVVG 
LCPSTEANLG DGIFDLPLWL QHGGRWGLGS DSHICVNAAE ELLLLEYGQR LSRRQRNVLA 
HATQPEVATA MSLQAVQGGA QAAGHGIGAG LAGIAVGRQA DLVVLDAQHL ALRGLPAHSM 
LSAHVFGSQR SSALDSLWVA GVRRVTQGRH ALHEAAAQDF IAARSAIIAA QRAGAIR