Gene Gdia_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1820
Symbol
ID	6975242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2018106
End bp	2019479
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	63%
IMG OID	643391345
Product	putative transporter protein
Protein accession	YP_002276195
Protein GI	209543966
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.398976
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGTTT CCCCCTGGCT GGCCGTCACC CTGACGTTGC GCCGTTTTTC CCTGGCGGTC 
CCCTGGCTGG CCGTGCTGTC CTCCAGCCTG ATTCCGCTGA CCGGCAATCT GACGCTCCTT 
TACATCCTGC GGATCTTCCA GGGGCTGTCC GGTGGGTTTA CCGTTCCGCT GCTGATGACG 
ACGGCCCTGC GGGTGCTGCC GCCGCCCATC CGGCTTTACG GCCTGGCGGC CTATGCCCTG 
ACCGCCACCT TTTTTCCCAG CCTGAGCACG GCCTTTGCGG GCCTGTGGAC CGATCTGGTC 
GATTGGCGCT TCGTGTTCTG GCAGTCCATT CCGCTCTGCA CGATCGCCTT CGTCCTGCTC 
TGGTATGGAA TGCCCGTCGA ACAACCCCGG CACGAGCGCT TCTGGCGTTT CGACTGGCAG 
GGGTTCCTGC TTGTCCTGAT CGGAATGGGC GCGTTTTCGA CCATGCTGCA AATGGGCGAC 
TGGATGGACT GGTTCAACAG TCCGGCCATC TGCGTCATGG CGTTGCTCAG TGGGGTCTGC 
ATTCCGCTTT TCGTGCTGAA CGAATGGTTC CATCCGTTGC CCCTGTTCAA GTTCCAGCTT 
CTGGAACGGC GGAATTTCGC CTACGGCGCC AGCACCCTGC TGACATTCAT GATCATCTCG 
CTGTCATCTT CCGCCCTGCC GGCAGATTTC CTGCGTGAAG CCGCCGGATA CAGGCCGGAG 
CAGACCTATC CCATCACCCT GGAAATCGCG GCGATCCAGA TCGTCATGCT GCCGCTGATG 
GCGGTGCTGC TGAACCGGAA AGGGGTGGAT TCCCGTATCG TCAGCCTTAT CGGCATGGCC 
TGCATCCTGA CGGCCTGCAT CGGGGACTTC TTCGTGACGT CCAACTGGAA CCGGGACCAG 
TTCTATCTGT GGCAGGCGTT TCAGGGCGTC GGCAACGCCA TGATCGTCAT GCCGTTGCTG 
ATGATGTCCA CCAATGCCCT TGTCCCCGAG GAAGGGCCCT TTGCCTCCGC CATGGTCAAC 
ACGCCCCGCG CCGTGGCCGA GGCCGTGGGG ATCTGGCTGA TCCAGCTTGT CCATCGCGAG 
CGCGGCGCGC TGCATTCCGA CCGTATCACC GACCGGCTCG GCCAGGATCG GTTCCAGCTT 
GTCCAGGGCA TGAATCCGGT GCTCCAGCGA CCCGCCGCGC TGACGCCGGA CGGGCTGCCG 
GCCTTTCCCG GCAGCATGAC CGCCCTGCAC GCGCAGGTCA CGCGACAGAC CGCGACCCTG 
ACCTACAGCG ACGACTGGCT CATCATTGCC GGGATCGTGG TGTGCCTGAT GGTGTGGGTT 
TGTGTCCTTC CGGTCCGAAC CTATCCCCCC CGTATCGTGT TCCAGTCGAA ATAG

Protein sequence

MSVSPWLAVT LTLRRFSLAV PWLAVLSSSL IPLTGNLTLL YILRIFQGLS GGFTVPLLMT 
TALRVLPPPI RLYGLAAYAL TATFFPSLST AFAGLWTDLV DWRFVFWQSI PLCTIAFVLL 
WYGMPVEQPR HERFWRFDWQ GFLLVLIGMG AFSTMLQMGD WMDWFNSPAI CVMALLSGVC 
IPLFVLNEWF HPLPLFKFQL LERRNFAYGA STLLTFMIIS LSSSALPADF LREAAGYRPE 
QTYPITLEIA AIQIVMLPLM AVLLNRKGVD SRIVSLIGMA CILTACIGDF FVTSNWNRDQ 
FYLWQAFQGV GNAMIVMPLL MMSTNALVPE EGPFASAMVN TPRAVAEAVG IWLIQLVHRE 
RGALHSDRIT DRLGQDRFQL VQGMNPVLQR PAALTPDGLP AFPGSMTALH AQVTRQTATL 
TYSDDWLIIA GIVVCLMVWV CVLPVRTYPP RIVFQSK