Gene Daro_3474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3474
Symbol
ID	3567342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3722263
End bp	3723417
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	55%
IMG OID	637681946
Product	porin
Protein accession	YP_286673
Protein GI	71909086
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	0.00203539
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.190966
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAGA AGATTATCGC TTTGGCCATC GCTGGTCTGG CTTCTACCGC TGCTTTCGCT 
CAATCCAACG TCACCATCTA CGGTGTTGCT GATGCCACCT TCGACAGCGT CAAGGCTACC 
AAGGGCTCTT CCGCCTCTGA GCAAGCTGCT TTCGTTACTC GTCAGCGCGT TACTGCCAAC 
TCTTCCTACA TCGGCTTCAA GGGTGTTGAA GATCTGGGCA ACGGCCTGAA GGCTGTCTTC 
CAGTTCGAAA ATGGTATTAA CAACGACAAC AGCAGCGCTG GTTCTTGGAA CAACCGTGAC 
TCCTACGTTG GTCTGTCTGG TGGTTTCGGT ACCGTTGTTG CTGGTAACCT GACTGGCCCG 
ACCCGTGCAG TTGGCGCCAA GTACGACGTC AATCAAGGTG CAACCGGTAT CGGCGCTAAC 
GCCGCTCTGC TCGGCAAGCT GGGTACCATC GCAGGTGATT CCGGCGCTTC CGCATTCGAT 
CAGCGTATCT CCAACGCTGT TGCCTACGTC TCCCCGACCG TTGCTGGTTT CACGGGCGTG 
ATCGGTTACT CCACCGGTCT GTCCAGCGCC GCTATCGCTG GTACTGCCGC TGCCGTGATT 
GGTACGAACC GCGAAGCTAC CGGTGCAGGT GATGTTCAGT TCAACACCGC TCGCACTCTG 
GGTCTCGGCT ACGCAAATGG CCCGATCTCG GTTGATTACG CCTACACCCG TGTTGGTCTG 
AAGGATGCTC AAAATGACCT CCAAGACCAT CGTCTGGGCT TCCTGTTTAG CCAAGGTTGG 
GGTTCTGTCG GTCTGCTGGC CGAGCGTACC TCCCTCCAGG CTACCACTGG CAACCTGACC 
CAGAACGTGT TCTATGTTCC GGTTAAGGTT AATGTTGGCA AGGGCCGTGT CATTGGTCAA 
TTTGGCCACG CTGGTAACGT GAAGAACACT GTTGCTTCCG AAGGTGCTAA CCACTACGTT 
CTGGGTTACG AGCACGATCT GTCCAAGCGT ACCACCCTGA AGTTGGTCTA TTCCCAGATC 
AACAACAAGG AAGGTTCGAA CTACGACTAC CTGTATGGCG CTGGCAATGC TAACAGCACG 
GCTACCAACA CCTCTGGTGT TGCTAACGAT GCAAACGTCA AGGGTATTTC CCTGGGCCTG 
CGTCACGCTT TCTAA

Protein sequence

MQKKIIALAI AGLASTAAFA QSNVTIYGVA DATFDSVKAT KGSSASEQAA FVTRQRVTAN 
SSYIGFKGVE DLGNGLKAVF QFENGINNDN SSAGSWNNRD SYVGLSGGFG TVVAGNLTGP 
TRAVGAKYDV NQGATGIGAN AALLGKLGTI AGDSGASAFD QRISNAVAYV SPTVAGFTGV 
IGYSTGLSSA AIAGTAAAVI GTNREATGAG DVQFNTARTL GLGYANGPIS VDYAYTRVGL 
KDAQNDLQDH RLGFLFSQGW GSVGLLAERT SLQATTGNLT QNVFYVPVKV NVGKGRVIGQ 
FGHAGNVKNT VASEGANHYV LGYEHDLSKR TTLKLVYSQI NNKEGSNYDY LYGAGNANST 
ATNTSGVAND ANVKGISLGL RHAF