Gene Gdia_0230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0230
Symbol
ID	6973622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	252364
End bp	253824
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	69%
IMG OID	643389761
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_002274642
Protein GI	209542413
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG1953] Cytosine/uracil/thiamine/allantoin permeases
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.239977
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACA CCCCGCCCCC TGCGACGGCC GCCGGCTACG ATCCCGGCCT GTATAACGCG 
GACCTGGCCC CGGTTCCGGC CGAGCGGCGG GACTGGAGCT GGGTGAACAT GGCCACGGTG 
TGGATGGGCA TGGTCCACAA CATCGTGGTG TACGAGGCCG CGTCGGGCCT GATGGCGCTG 
GGCCTGTCGG CCTGGGAATG CCTGGAGGTC GTGGCCGTCG CCTACATGGT GCTGTTCCTG 
GCCATGTGGT TCAACGCCCG TGCCGGCACG CGCTACGGCA TTCCGTTCTG CGTGCTGATC 
CGCTCGGCCT TCGGGCCGTA CGGCGCGCAG CTTCCGGTCG TGCTGCGCGG ATTCTGCGCC 
ATCTTCTGGT TTTCGGTGCA GGCCTATGCG GCGGCGCAGG CGGTGGATGC GGTGCTGTCC 
ACCCTCAGCC CCGCCTGGGC GTCGATGACC CCGTCCCTGC TGGGCATGCA GGCGCGGATG 
TGGCTGGCCA TGGCCATGGT CTGGGCGCTG CATGCCTGGA TCGCCAGCCA CGGCGTGCAC 
CGGATCCGCA ATTTCGAGCT TGTCGCCGGG CCGCTGGTCA TCATCGTGGG CCTGCTGGCC 
ACGATCTGGG GGCTGCGCGT CGGCCATGGG CTGGGGCCGC TGTTCGCGCA GCCGTCGCAC 
CTGCATGGGG CGGCATTCTG GTCCACCTTC GCCATGGGGG TGACCGGCAT GATCGGCATG 
TGGGCCACCT TCGCCGTCAA TATTCCGGAC CTGTCGCGGT TCGTACGCTC GGAACGCGAC 
CAGGTGGTCG GCCAGGCGAT CGGCCTGCCG ATCACGGCGC TGGTCTTCAC GCCGATGGGC 
ATCATCACCA CGTCGGCCAC AATCATCTTG TTCGGCCACC CGATCTGGAA CCCGGTGGAC 
CTGCTTCTGG CGCTGAACCA TCCTGTCGTG ACCGTCCTGG GCGGGGCCAC GCTGGTGCTG 
GCGACGCTGT CGGTCAACGT CGTCGCGAAC ATCATGCCCG CCTGCTACGA CCTGGTGAAC 
CTGATGCCCC GGCGGCTGGA CTTCAACCGG GCGTCGCGGC TGGTCCTGGT GCTGGGCGTG 
TTCTTCATGC CCTGGCTGTG GTTCAACGAA GCCGCCGGCA TCTATCGCGT GCTGGACCTG 
ATCAGCGGCC TTCTGGGCCC GGTGACGGGG ATCATGCTGG CCGATTTCTA CATCGTGCGG 
CGGCAGGTGC TGGATGTACC GGCGCTGTAC CGGCATGGCG GCCGGTACGA CGGCCGAAAC 
GGATGGAACG TCCCGGCCCT GGCCGCCTTC GCCGCCGGCG GCGCGGTGGC GTCGGCCGGC 
CACGTCGTGC CGGGTCTGGC CGGCCTGAAT ACGGTCGCGT GGTTCGTGGG CGTCGCCATC 
GGTGCCGGGC TCTATCTGGC GTTGTCGCCC CGCCGGGATG CGCACCCGGC GGAAGACGCC 
GCAACGCTGT CAAACGCGTG A

Protein sequence

MTDTPPPATA AGYDPGLYNA DLAPVPAERR DWSWVNMATV WMGMVHNIVV YEAASGLMAL 
GLSAWECLEV VAVAYMVLFL AMWFNARAGT RYGIPFCVLI RSAFGPYGAQ LPVVLRGFCA 
IFWFSVQAYA AAQAVDAVLS TLSPAWASMT PSLLGMQARM WLAMAMVWAL HAWIASHGVH 
RIRNFELVAG PLVIIVGLLA TIWGLRVGHG LGPLFAQPSH LHGAAFWSTF AMGVTGMIGM 
WATFAVNIPD LSRFVRSERD QVVGQAIGLP ITALVFTPMG IITTSATIIL FGHPIWNPVD 
LLLALNHPVV TVLGGATLVL ATLSVNVVAN IMPACYDLVN LMPRRLDFNR ASRLVLVLGV 
FFMPWLWFNE AAGIYRVLDL ISGLLGPVTG IMLADFYIVR RQVLDVPALY RHGGRYDGRN 
GWNVPALAAF AAGGAVASAG HVVPGLAGLN TVAWFVGVAI GAGLYLALSP RRDAHPAEDA 
ATLSNA