Gene Pden_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_3643
Symbol
ID	4582195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008687
Strand	+
Start bp	793859
End bp	795055
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	71%
IMG OID	639770953
Product	major facilitator transporter
Protein accession	YP_917406
Protein GI	119386351
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0314134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.384152
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCCGC AGCCCAATCT CAAGCTTGCC ATCCTTGCCC TTGGCCTTGG CGCCTTTGCC 
ATCGGCACTT CGGAATTCGC CGCCATGGGG CTGCTGCCCT GGTATGCCAG CGACCTCGGC 
ATCACCGAGC CGCAGGCGGG CCATGTGGTT TCCGCCTATG CGCTTGGCGT GGTCGTGGGG 
GCGCCCGTCA CCTCGATCCT GGGCGCGCGG CTGCCGCGGC GGCGCTATCT TGCGGCGCTG 
ATCGCGGTTT ATGGCGCGAT GAACCTGCTG GCGGCGGTGC TGCCGGGTTA CGGCACGCTG 
GTCGGCATGC GCTTTCTGGC CGGCTTGCCG CATGGCGGCT TTCTGGGCGT GGCCATGCTG 
TTTGCCGCCG ATGCCCTGCC GCGCGAACAG CGTGCCAAGG GCGTGACGCA GGTGCTGCTG 
GGGCTGACCA TCGCCAATAT CGCCGGGGTG CCCTTGGCCG GTATCCTGGG GCAGGGCTTC 
GGCTGGCGCT GGGGTTTCGC GCTGCCCGGC GTGCTGGCGC TGTTGGCGGG CTGGCTGATC 
CTGCGGCTGG CGCCCCGGGT CGGCGCGCCC AAGGACGCGC GGCCGCTGGC CGAACTGAGG 
GCGCTGCGCA ATCCGGCGGT CATGCTGATC CTGCTGGTCG GCGCCATCGG CTTCGGCGGG 
CTTTTCGCGG TCTATTCCTA TCTTTCCGCC GCGATGCTGG CGACGGCCCA GCCGCCGGGC 
TGGGCCATAC CGGCTGCGCT TTCGGCCTTT GGCATCGGCG GCACGCTAGG CAGCATTCTG 
GCCGCCCGCC TGACCATCCG GCACGGCACC TGGGGCGCGG CCTTGCGGCT GATGCTGTTC 
ATGGCCGTGA CCCAGGGCTT TGCGGCCTGG GCGGTGGGCA ATTGGGGGCT GATGCTGGTC 
TCGTCCTTCC TGCTGGGTCT GGGCTCGGGC ATGGTGGTGC CCTTGCAGAC CCGGCTGATG 
GATGTCGCGG GCGAGGCGCA AAGCATGGCC GCGGCGATGA ACCATGCGGC CTTCAACGCC 
GCCAATGCGC TGGGGCCGTG GCTGGCCGGG CTGGCGCTGG CGGCGGGCTG GGGCTGGCGT 
TCCTCGGGCC TGGTGGCGGT GGCGCTGTCA GGGGCCGGTC TGCTCGCCCT CGGCCTTGCC 
TGGCGGCAGG CCCGTCTCTC CGGGTACCAA CTGCATGATC GCCCGGCGCG AGTGTGA

Protein sequence

MSPQPNLKLA ILALGLGAFA IGTSEFAAMG LLPWYASDLG ITEPQAGHVV SAYALGVVVG 
APVTSILGAR LPRRRYLAAL IAVYGAMNLL AAVLPGYGTL VGMRFLAGLP HGGFLGVAML 
FAADALPREQ RAKGVTQVLL GLTIANIAGV PLAGILGQGF GWRWGFALPG VLALLAGWLI 
LRLAPRVGAP KDARPLAELR ALRNPAVMLI LLVGAIGFGG LFAVYSYLSA AMLATAQPPG 
WAIPAALSAF GIGGTLGSIL AARLTIRHGT WGAALRLMLF MAVTQGFAAW AVGNWGLMLV 
SSFLLGLGSG MVVPLQTRLM DVAGEAQSMA AAMNHAAFNA ANALGPWLAG LALAAGWGWR 
SSGLVAVALS GAGLLALGLA WRQARLSGYQ LHDRPARV