Gene Gdia_3221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3221
Symbol
ID	6976661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3529202
End bp	3530389
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	643392734
Product	protein of unknown function DUF214
Protein accession	YP_002277566
Protein GI	209545337
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.612368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.761835
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGA TCGGAAGGCT GGCGTGGCGG GACGTGCTGT CCGAGAAGAT CATGGCCCTC 
TGCCTCATCG TCGGTCTGGC GGCTACGGCG GCGCCGCTGC TGGTCATCGC AGGATTGCGC 
GCCGGCCTGG TCGAGGGATT GCGGGCCTCG CTGCTGGAAG ATCCTAGGAT TCGCGAAATA 
TCGAATGCCG GCAACCGGGA TTTCGATGCC GCATGGCTGG CGGCGCTGGG CCGCCGTCCC 
GAGGTCGTTT TCGTCAGCCC CCGGACCCGG ACCCTGGCCG CCAGCGCGCT TCTCGTTCCC 
CCGGACCGGC CGCAGGATGC GCGGCGGGTG GAGCTTCTGC CCTCGCACGC CGGTGACCCG 
CTGCTGACGC CGGCAGACAT GCCGGCCGAT CCCTCCGGCA TCGTCCTGTC GGCGCCGGCG 
GCGGCGGCAC TGCATGTACG GGCGGGTGAC GGGCTGGACC TGCATGTCGC ACGGCTGGGG 
GAAGGCGCGG CGCAGGAAAT CCTGCCCGTG CGGGTCGCGG CGGTGGCGCC GCAGCGCGCC 
ACGGCCCACG ATACGGCATT CGTGGCCCTC CGGCTGGCCC AGACGGTGGA GGTCTTCCGC 
GAGGACCCGC TGTCCTGGCC CGACGCCTGG GCGAAGGCCG GGCAGTCGGC ACATGTATGG 
GCCGGTTTCA GGCTGTATGT GCGCCGTCTG GACGACGTTC CGGCCGAGGA TGCCGCCCTG 
CGCGCGGCGG GAATCGACGT CGTGTCGCGG GCGGGGGACG TGTCCGGCCT GCTGACCCTC 
GACCGTCGCA TGACCTTGCT GTTCCGGCTG ACCGCCTGCA TGGGGGTCGC CGGATTTGTC 
GCCAGCCTTG CGGCGGGGCT GTGGGCGAAT GTCGAACGTA AGCGGCTGTC GCTGGCGACC 
TTGCGTTTCG TCGGGGTGCC GTTCCTGGGG GGATTTCCGC TGATCCAGGC GCAGATCCTG 
GCGATCGGCG GCATCGCGCT GGCCCTGTGC GGCGCGGCGC TGGTGGGGCG GGTGATCAAT 
CATCAGTTCG CGCAAGTCCT GCCGCCCGGG CATCCGCTGT GCATCATTGA CGGGCGGCTT 
TGCGTCCTGG CCAGTGCGCT GACGATCGCC GGGGCGTTCC TGGCCTCGGC GGCGGCAGCG 
TTCCGGGCGG GCCGCATCGA TCCCTGGGAA GGAGTCAGCA CCCCGTGA

Protein sequence

MLLIGRLAWR DVLSEKIMAL CLIVGLAATA APLLVIAGLR AGLVEGLRAS LLEDPRIREI 
SNAGNRDFDA AWLAALGRRP EVVFVSPRTR TLAASALLVP PDRPQDARRV ELLPSHAGDP 
LLTPADMPAD PSGIVLSAPA AAALHVRAGD GLDLHVARLG EGAAQEILPV RVAAVAPQRA 
TAHDTAFVAL RLAQTVEVFR EDPLSWPDAW AKAGQSAHVW AGFRLYVRRL DDVPAEDAAL 
RAAGIDVVSR AGDVSGLLTL DRRMTLLFRL TACMGVAGFV ASLAAGLWAN VERKRLSLAT 
LRFVGVPFLG GFPLIQAQIL AIGGIALALC GAALVGRVIN HQFAQVLPPG HPLCIIDGRL 
CVLASALTIA GAFLASAAAA FRAGRIDPWE GVSTP