Gene Gdia_1115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1115
Symbol
ID	6974519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1252199
End bp	1253629
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	62%
IMG OID	643390644
Product	Carbohydrate-selective porin OprB
Protein accession	YP_002275513
Protein GI	209543284
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3659] Carbohydrate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.967056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.588415
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCA CTTTTTCGCG CACGCGCCCC AGCCTTGCCT GGCGCATCTG GATCATGGCG 
GCCGTAGCCG TCCTTTCCTG CCATCCCGCC CGCGCGCAAT ATCGTGGTCC GGTCGCGGAA 
ACCGCCCCGT CCTTCTCGCT CGATACCCCC ACATCGTACG CGAACACCCC GTTCACCCCG 
CCGGTTGAAC ACATGGTTTC AGCCTGGGGC AACGCCGTCC AGAACCTCAA CCGCAAGGGA 
ATCGGCCTGG TCATCGACTA TACCAGCGAA AGCGCACTGG CGCTCGATGC CGGCAATGCC 
GGGGACGCAG GCTATGCACA CCAGATCGGC GTACAGTTGG ACCTGGATTG GGACAAACTG 
GTGGGCTGGC GCGGCTTTGT GACCCATGCG GCCATCGTCA ATCGGGCGGG CCATAACATG 
GCCGCCGATT TCGGTGACAG GTCACTCAAC GGATTCCAGG AGATCTATGG CGGCGGCGGC 
AATACGGCCG TTCACATGGT CTATGTCTAT GGCACGCAGA ACCTGTTCCA CGACCGCGTG 
CAGATCGCGA TCGGCAAGCT GCCGGTCAAT ATCGACTTTT CCGCGTCCCC CCTGTTCTGC 
ACGTTCATGA ACAAATCCAT GTGCGGAAAC CCCAAATCCC TGACCCGCGG CGCCGCGGGT 
TTCGGCACCT ATCCGGGTTC GACCTGGGGG ACGCGCGTAC GCTACTGGCC CATGCACGGG 
GTCTACGCGC AGGCCGGACT GTACGGCGTC AATCCGGACC TCAATACCAA TCGGTATGAC 
CGCACCGGAT TCAACTTCAA CACGAATCTC TATACCGGCG TCTACGTTCC GGTCGAGGTC 
GGCCTGATCC CGTCCTTCGG CAGGAACCAG CTTGTCGGTC ACTACAAGGT CGGCGTCGCC 
TACGATTCCT CGAACTACGC CGACAATTAC TACGATGTTA ACGGCGCCCC CCTGGCGCTG 
ACGCGCAGGG CCGCGCGGAT GGACACCGGC AAGACGCAGC TCTGGATCGA AGGCGACCAG 
ATGCTGATCC GCAACGGCCA TGGCCCGCTC AACGGATTCT ATGTCATGGC CGGCCTGGTG 
CGTAACACGC CGGAAAGCAG CCCGTACCTC TATCAATATT ATTTCGGGAT CGTGGACCGG 
GGCTTCTGGC GCGCGCGCCC CGACGACACG TTCGGCATCG AGGTCTCGCG GGCCACGGCC 
AGTCCGGACC TTGTCGATAC GCAATGGCTC GATTACGCAG CGGGGCGCAA GCTGCCGGCC 
AATGCCACCT ATCCGCAAAG CCATATCAGC GTGCTGGAAG CCACCTACAA CATCCACGTC 
TGCGAGGGGC TCTCGATCCA GCCGGACTAC CAGCGGATCA TGCGGCCCAA CCTGCAGCGC 
AACAAACCCG CGATCGACGC GATCGGCCTG AAGATCCACG CGACGCTCTG A

Protein sequence

MRITFSRTRP SLAWRIWIMA AVAVLSCHPA RAQYRGPVAE TAPSFSLDTP TSYANTPFTP 
PVEHMVSAWG NAVQNLNRKG IGLVIDYTSE SALALDAGNA GDAGYAHQIG VQLDLDWDKL 
VGWRGFVTHA AIVNRAGHNM AADFGDRSLN GFQEIYGGGG NTAVHMVYVY GTQNLFHDRV 
QIAIGKLPVN IDFSASPLFC TFMNKSMCGN PKSLTRGAAG FGTYPGSTWG TRVRYWPMHG 
VYAQAGLYGV NPDLNTNRYD RTGFNFNTNL YTGVYVPVEV GLIPSFGRNQ LVGHYKVGVA 
YDSSNYADNY YDVNGAPLAL TRRAARMDTG KTQLWIEGDQ MLIRNGHGPL NGFYVMAGLV 
RNTPESSPYL YQYYFGIVDR GFWRARPDDT FGIEVSRATA SPDLVDTQWL DYAAGRKLPA 
NATYPQSHIS VLEATYNIHV CEGLSIQPDY QRIMRPNLQR NKPAIDAIGL KIHATL