Gene Gdia_3489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3489
Symbol
ID	6976941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3819405
End bp	3820646
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	65%
IMG OID	643393009
Product	putative pilus assembly protein
Protein accession	YP_002277828
Protein GI	209545599
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4963] Flp pilus assembly protein, ATPase CpaE
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0553969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGGA CGATCTCCGC CCCCCGGGCC CAGACGAATG CCGAAGGCAC GCCACCCTCG 
GAAATCCTTG CGCTGGTCTC GGACGCTTTC ACGGAATCCC TGCTGCGGGA GTGCCTGGCG 
GACCTGCATC ACCAGGACAG CACGGTCATG CGCATGTCCT GCCAGCAGGC GGTCGAGTAC 
CTGCGGAGTC ACGAGACTCC CGGGATCCTG ATCCTGGATG TCAGCGGCGA GGACCAGCCG 
CTGACGACGT TGACCGAACT GGCGAATGTC GTGTCGCCCG ACGTCACGGT CCTGCTGATC 
GGCGATCGGG AAGATGCCAA TTTCTATCGG CAGGTGACGC GCGGATTCGG CGTTTCCGAA 
TATCTGTACA AGCCGCTGAA CCGCAGCATG GCGACGCGGT TTTTCGGACC GGTCATCATG 
GGCGGCGAGG TCGCGCCGGA TGCGCCGCGT GGTGGGCGCG TGATTACGGT CAGTGGCGTG 
CGCGGCGGTG TGGGCGCCAC GACGATCATG ACCAACCTGG GATGGTACCT GGCCGAGGAA 
GCCAAGCGAC ATACCGTGAT CGTCGATTTC GACCTGACGA CCGGCAAGAC CGCGCTCCTG 
CTGGGGACGC AGAGCAATAA CGGCCTGCGC TCGGCCATGG AAACGCCCGA TCGCGTGGAC 
ACCTTGTTCC TGGAACGCAG CGCGCAACTG GTCGGCGACC GGCTGAACCT GCTGTCGAGC 
CTGAGCGACC TGCAGACGCG GCCGAAGACC AGTGCCGCGG CCATGCGCCA CCTGATGGCG 
ACGGTCACAA AGCGATATAA TTTCGTCCTG GCGGAAGCCC CGCTGTGCCC GGACGAGACC 
GAGGCCGCGT TGCTGGACGT CACGTTCCAG CGGATTATCG TTCTCGATCC GACATTGGCG 
GCCGTGCGCG ATACGCTGCG AATCATGCCC CTGCTTCAGA CCCGGGGACA GGGGTCCCAG 
CCGCTGGTGG TGCTGAACGG ACTGGGGCGG CCGGGTACGC TGACGCTGGA TGAGGTGGTG 
AAGAGCCTGG GAGACAAGCC TGACGTGGTC ATTCCCTTCC TGCCCAAGCC CCTCGGGACG 
GCCGAAGTGG ACGGCATCCC GGCGGTGAAG ACCTGCAAGG AGTTCCGGTC GGCCATCGTG 
AAGCTGACGC ACGAGGCCGC ATCGGTGGTC GCCGACCAGC CGCATCATGC GCCCGGATTT 
TCGTCGGGCC TGTTCCGGCG CCTGTTCGGT CGCGGCACAT GA

Protein sequence

MSGTISAPRA QTNAEGTPPS EILALVSDAF TESLLRECLA DLHHQDSTVM RMSCQQAVEY 
LRSHETPGIL ILDVSGEDQP LTTLTELANV VSPDVTVLLI GDREDANFYR QVTRGFGVSE 
YLYKPLNRSM ATRFFGPVIM GGEVAPDAPR GGRVITVSGV RGGVGATTIM TNLGWYLAEE 
AKRHTVIVDF DLTTGKTALL LGTQSNNGLR SAMETPDRVD TLFLERSAQL VGDRLNLLSS 
LSDLQTRPKT SAAAMRHLMA TVTKRYNFVL AEAPLCPDET EAALLDVTFQ RIIVLDPTLA 
AVRDTLRIMP LLQTRGQGSQ PLVVLNGLGR PGTLTLDEVV KSLGDKPDVV IPFLPKPLGT 
AEVDGIPAVK TCKEFRSAIV KLTHEAASVV ADQPHHAPGF SSGLFRRLFG RGT