Gene Gdia_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1023
Symbol
ID	6974420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1154211
End bp	1156193
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	65%
IMG OID	643390545
Product	conjugal transfer coupling protein TraG
Protein accession	YP_002275421
Protein GI	209543192
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGA CCAAGATCCT CTGGGGATCG GTGTGTGCGG TAAGCACCGT GATCCTCGCC 
TTTACCTGGG CCGCGACGCA GTGGACTGCC TGGCGGCTCG GCTTCCAGCC GCAGCTTGGC 
GCGCCGTGGG TCACGCTGCT CGGCTGGCCG GTTTATTACC CGCCGGAGTT CTTCTGGTGG 
TGGTTCGCCT ACGACGCCTA CGCTCCGGAC ATCTTCACGA TGGGCGGGTA TATCGCGGCG 
GCAGGCGGTG TGGCCGCCGT CATCATCGCG ATCACGATGT CCGTCTGGCG CGCTCGTGAG 
AAGAAACGCG CCACCACCTA TGGCTCGGCG CATTGGGCCG ATCCGCGTGA GATCCGTCGG 
GCGGGACTGC TCGCCCCCGA TGGGGTGGTG CTGGGCCGCT CGGCCGATGT CTATCTCCGC 
CATGACGGGC CGGAACATGT GCTGTGCTTT GCACCGACCC GCTCGGGCAA GGGCGTCGGG 
CTGGTGGTGC CGACGCTGCT GACGTGGCCG GGCTCCGCCA TCGTCCATGA CATCAAGGGA 
GAGAACTGGA CGCTGACCGC CGGCTGGCGC TCGCGCTTCG GCCGGGTGCT GCTATTCGAT 
CCGACTAATC TGGCCAGCGC CGCCTACAAT CCGCTGCTGG AAGTCCGGCG CGGTGAGCGG 
GAGGTCCGCG ACGTGCAGAA TATTGCAGAC GTGCTGGTCG ATCCCGAAGG CGCCCTGGAG 
AAGCGGAACC ACTGGGAAAA GACCAGCCAT GCGCTGCTGG TCGGCACGAT CCTGCATGTC 
CTCTATGCCG AGGAGGACAA GACCTTGGCC GGGGTAGCCA ATTTCCTCTC CGACCCGAAA 
CGCGCCATCG AGACCACGCT ACGCGCCATG ATGACCACGC CGCATCTCGG GGCGAAGGGC 
GTGCATCCGG TCGTTGCCAG TTCGGCGCGC GAACTGCTCA ACAAGAGCGA CAATGAACGC 
TCCGGCGTGC TGTCCACCGC CATGTCGTTT CTCGGCCTGT ATCGCGATCC GGTCGTGGCG 
CATGTGACGC GGCGCTGCGA CTGGCGCATC CGCGATCTTG TCGCCGGCAG CCATCCGGCC 
ACACTCTATC TGGTGGTCCC GCCTTCGGAC ATCAGCCGCA CCAAGCCGCT GGTAAGGCTC 
GTACTGAACC AGATTGGCCG CCGACTGACG GAGGAACTGG AGGCGAAACG ACGCCATCGG 
CTGCTGCTGA TGCTCGATGA ATTCCCGGCG CTCGGGCGGC TGGATTTCTT CGAGAGTGCG 
CTGGCCTTCA TGGCGGGCTA CGGTATCAAG AGCTTCCTGA TTGGCCAGAG CCTGAACCAG 
ATCGAGAAAG CGTATGGGCA GAACAATTCT ATCCTCGACA ACTGCCATGT CCGGGTCAGC 
TTCGCCACAA ATGATGAGCG GACCGCCAAG CGCGTATCGG ATGCGCTCGG CACCGCGACC 
GAGATCCGGG ATGCGAAAAA CTATGCCGGG CATCGGCTGT CGCCGTGGCT CGGGCATCTG 
ATGGTGACAC GCCATGAGAC CGCGCGGCCT TTGCTCACGC CCGGCGAAAT CATGCAGCTT 
TCCCCAGACG AGGAACTGGT GCTGGTCTCG GGTTGTCCGC CGGTCCGGGC GCGCAAGGCG 
CGGTATTTCG AAGATGCAGA ATTGGCCGCG CGCATCCTCC CGCCACCCCG GTTCGAGCCA 
CCGCCATCTC CCGAAGGAAC GCCGCCCATC AGGCCGCAGC CGCCAGGGGA CTGGGCTGAT 
GTGGTCCAGC CGCTTCCTGC CGGGAATGCG GATGATGATC CCGCCAATGC CGGCATCCGC 
CGTGAGCCGG AACTGCCGGA ACAGGAAGAG GTGGTGCAGG CACCGAGGAA GCCGGTGCAT 
GAATTTGATC CGCCGGAGGA TGAACCCGAG GACGATGCGA AGCGGGCACA GACCTTGCGG 
TGCGGTGAGC GGGGTCTCGC GCGTCAGGTT TCGCTCGATC CTGGCGATCG GATGGGGCTA 
TGA

Protein sequence

MNQTKILWGS VCAVSTVILA FTWAATQWTA WRLGFQPQLG APWVTLLGWP VYYPPEFFWW 
WFAYDAYAPD IFTMGGYIAA AGGVAAVIIA ITMSVWRARE KKRATTYGSA HWADPREIRR 
AGLLAPDGVV LGRSADVYLR HDGPEHVLCF APTRSGKGVG LVVPTLLTWP GSAIVHDIKG 
ENWTLTAGWR SRFGRVLLFD PTNLASAAYN PLLEVRRGER EVRDVQNIAD VLVDPEGALE 
KRNHWEKTSH ALLVGTILHV LYAEEDKTLA GVANFLSDPK RAIETTLRAM MTTPHLGAKG 
VHPVVASSAR ELLNKSDNER SGVLSTAMSF LGLYRDPVVA HVTRRCDWRI RDLVAGSHPA 
TLYLVVPPSD ISRTKPLVRL VLNQIGRRLT EELEAKRRHR LLLMLDEFPA LGRLDFFESA 
LAFMAGYGIK SFLIGQSLNQ IEKAYGQNNS ILDNCHVRVS FATNDERTAK RVSDALGTAT 
EIRDAKNYAG HRLSPWLGHL MVTRHETARP LLTPGEIMQL SPDEELVLVS GCPPVRARKA 
RYFEDAELAA RILPPPRFEP PPSPEGTPPI RPQPPGDWAD VVQPLPAGNA DDDPANAGIR 
REPELPEQEE VVQAPRKPVH EFDPPEDEPE DDAKRAQTLR CGERGLARQV SLDPGDRMGL