Gene Gdia_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1983
Symbol
ID	6975409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2200429
End bp	2201655
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	66%
IMG OID	643391512
Product	protein of unknown function UPF0118
Protein accession	YP_002276358
Protein GI	209544129
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCTG TACCCGATCT GGACGATGCC GACATGTTCG AGGCACATCA GCAGCAGCGC 
GCGGCCGAGG TCGTGCGTCG CAGCCGCTTC GATCCCCAGA CCATCTGCCT GCTGATCCTC 
ACGGTCCTGG CGGTCTTCTA CACGCTGTAT TTCGCGGCGG CGATCATCCT GCCGATCGTG 
CTGGCGCTGG TGGTCAACCT GCTGCTGTCG GCGCCGATGC GGGTGCTGCA TACGCGGCTG 
CACCTGCCCA AGACGCTGTC GGCGCTGGTG CTGATCCTGG GCGTGTTCGG GGTGGTGGGC 
GCGATCGGCA CCGCGATCTC GGTACCCGCC GCCGGCTGGA TCGCGCGCGC GCCGCAGACC 
ATGGCCGCCC TCCAGACGCA CCTGGCCGTC CTGCACCGCC CGATCCAGAT GATCCAGGCG 
GCCAATGACC GGATCGAGAA TTTCCTGTCC GTCGTCAGCG GACGGCAAGG GGGCGGTGGC 
GGCGGTCAGG TGGTGCTGCT GGCGCCCTCG TCGTCGCCGG GCGGCGGGCT GGGCACGTTC 
GGCTCCAGCG TGCTGCTGGG CACGCGTGCC TTCGTGGGCC AGCTCTTCAC CATGATGCTG 
ATGCTGTTCT TCCTGCTGGC GCAGGGCGAC AGCCTGCTGC GCCGGTTCGT CGAGATCATG 
CCGACCTTCG CCGACAAGCG CCGCGCGGTG CAGATCGCCT ATCAGATCGA ACGCAATGTC 
TCGCTCTATC TGACCACCAT CACGATCATC AACGTGCTGG TCGGCCTGGC GAACATGCTG 
CAATGCTGGG TGTTCGGCAT GCCGAACCCG CTGCTGTGGG GGGTCCTGGC CTTCCTGCTG 
AACTATATTC CCATCATCGG GCCGCTGACC GGCATCGTGA TCTATTTCGT CGTCAGCCTG 
TTCGTCTTTC CGTCGGCCCT GCAGGCGCTG CTGCCGCCCA CGGTGTATCT GTGCATCCAC 
CTGATGGAAG GCGAGACGAT CACGCCGATG GTGCTGGCCC GGCGCTTCAC CCTCAATCCG 
GTGCTGGTCA TGGGCTCGCT GATGTTCTGG GACTGGCTGT GGGGCGTGTG GGGGGCGTTC 
CTGTCGGTGC CGATGCTGGC GGTGTTCAAG ATCATCTGCG ACCATGTCGA TGTCCTGACC 
CCGATCGGCC ACGTTGTCGG CGGCCCGACC CGCGCACGCA CCGTACAGTC CGCGATCATT 
CCCCGGCGGG AACAGGAAAC CGAATAG

Protein sequence

MPPVPDLDDA DMFEAHQQQR AAEVVRRSRF DPQTICLLIL TVLAVFYTLY FAAAIILPIV 
LALVVNLLLS APMRVLHTRL HLPKTLSALV LILGVFGVVG AIGTAISVPA AGWIARAPQT 
MAALQTHLAV LHRPIQMIQA ANDRIENFLS VVSGRQGGGG GGQVVLLAPS SSPGGGLGTF 
GSSVLLGTRA FVGQLFTMML MLFFLLAQGD SLLRRFVEIM PTFADKRRAV QIAYQIERNV 
SLYLTTITII NVLVGLANML QCWVFGMPNP LLWGVLAFLL NYIPIIGPLT GIVIYFVVSL 
FVFPSALQAL LPPTVYLCIH LMEGETITPM VLARRFTLNP VLVMGSLMFW DWLWGVWGAF 
LSVPMLAVFK IICDHVDVLT PIGHVVGGPT RARTVQSAII PRREQETE