Gene Gdia_0227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0227
Symbol
ID	6973619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	248002
End bp	249429
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	69%
IMG OID	643389758
Product	phenylhydantoinase
Protein accession	YP_002274639
Protein GI	209542410
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0770073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.255137
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCTGG TGCGTGGTGG CACGGTCGTG ACGGCGGAAT GGTCGCGGCG GGCGGACGTG 
CTGTGCGACG ACGCGGGGCG GATCGCCGCC GTCGGGCCGG CGCTGGACGT GCCCGTGGGC 
TGCGACGTCC TCGATGCCGG CGGGCTTCTG GTCATGCCGG GCGGGATCGA CCCGCACACC 
CATATGGAAA TGCCGTTCAT GGGATCGGTC TCCAGCGACG ATTTCCAGAC CGGAACCGCC 
GCCGGGGTGG CGGGCGGCAC GACGACCATC ATCGATTTCG TGATTCCCGA TCCGGGGACA 
TCGCTGCTGG GCGCCTGGAA GGACTGGCGG GCCAAGGCCG AAAAGGCGGT CTCGGACTAT 
TCGTTCCATG TCGCGGTCAC GCATTGGGAC CAGCGGGTGC ATGACGAGAT GGGCATCCTG 
ACCCGGGATT GCGGGGTCAA TTCCTTCAAG CATTTCATGG CGTACAAGGG GGCGCTGATG 
GTCGATGACG GGGTGCTGCT CCGTTCGATC GGCCGCGCGC TGGAACTGGG CGCGCTGTGC 
AACGTGCATG CCGAAAACGG TGACGCCGTC GCCTACCTGC AGCAGGATTT GCTGACGCGC 
GGCGTGACCG GCCCCGCCGC CCATCCCCGG TCCCGCCCGC CCGCGGTCGA GGGCGAGGCC 
GCGCAGCGCG TCATCGCCAT TGCCGGCCTG CTGGGCGCGC CGGTCTATAT CGTGCATGTC 
TCGACCGAGG AAGCCGCCGC CGCCATCGCC GCCGCCCGCG CCCGTGGCCA GCGCGTGTAT 
GGCGAAGTGC TGGCCCAGCA TCTGGTGATC GATGACGGTG TCTATGCCGA CCCGGACTGG 
CTGGGCGCCG CCCGGCATGT CATGAGCCCG CCTTTCCGCC CGAAACATCA CCAGCACGCC 
CTGTGGGCGG GCCTGGCCTC GGGCCAGTTG CAGACGACGG CGACCGATCA TTGCTGCTTC 
TGCGCCGGCC AGAAGCAGCA GGGGCGCGAC GATTTCTCTC AAATCCCGAA CGGCACCCCG 
GGCATCGAGG ACCGGATGAG CGTGCTGTGG CACCACGGCG TGCGTACCGG GCGTCTGACG 
CCGGAGGAAT TCGTGGCCGT CACCTCGGCC AATGCCGCGA AGATCTTCAA CATCCATCCC 
CGCAAGGGCA CCGTCACGCC GGGCGCCGAT GCCGACCTGG TCCTGTGGGA CGCCGATTCC 
AGCCGTACCG TATCGGCCGC CACCCATCAC CAGAACGTCG ATTACAATGT CTATGAAGGC 
ATGACCCTGA CCGGCCTGGC GCGTCATACG ATCAGCGGGG GCCGGGTGGT GTGGTCGGAT 
GGCGACCTGC GCACGGTGCG CGGTGCCGGC CGTTACGTCG AACGGCCCTG CTTCGCCCCC 
GACATGGCGG CCCAGGCCAG GCGGAACGCC GTTGCGGCCG GGCGGTGA

Protein sequence

MLLVRGGTVV TAEWSRRADV LCDDAGRIAA VGPALDVPVG CDVLDAGGLL VMPGGIDPHT 
HMEMPFMGSV SSDDFQTGTA AGVAGGTTTI IDFVIPDPGT SLLGAWKDWR AKAEKAVSDY 
SFHVAVTHWD QRVHDEMGIL TRDCGVNSFK HFMAYKGALM VDDGVLLRSI GRALELGALC 
NVHAENGDAV AYLQQDLLTR GVTGPAAHPR SRPPAVEGEA AQRVIAIAGL LGAPVYIVHV 
STEEAAAAIA AARARGQRVY GEVLAQHLVI DDGVYADPDW LGAARHVMSP PFRPKHHQHA 
LWAGLASGQL QTTATDHCCF CAGQKQQGRD DFSQIPNGTP GIEDRMSVLW HHGVRTGRLT 
PEEFVAVTSA NAAKIFNIHP RKGTVTPGAD ADLVLWDADS SRTVSAATHH QNVDYNVYEG 
MTLTGLARHT ISGGRVVWSD GDLRTVRGAG RYVERPCFAP DMAAQARRNA VAAGR