Gene Pden_0803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_0803
Symbol
ID	4580627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008686
Strand	-
Start bp	777739
End bp	779373
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	68%
IMG OID	639768122
Product	protein of unknown function DUF894, DitE
Protein accession	YP_914611
Protein GI	119383555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.288414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCCC CTGCCCGCAA GAGCCCCTTT GCCCCGTTCC GCCATCGCGA CTTCCGCCTG 
CTCTGGTCGG CGACGCTGAT CTCGAATTTC GGCGGGCTGG TCCAAGCGGT GGGGGCGGCC 
TGGATGATGA CGCAGCTGAC CGATTCGGCG ACGCTGATCG CGCTGGTGCA AGCATCCAAC 
ACGCTGCCGA TCATGCTGTT TGCGCTGCTG TCGGGCGCGC TGGCCGACAT CTTCGACCGC 
CGCACGCTTC TGCTCGGGGC ACAGGTCTTC ATGGCCGCGG TCTCGGTGCT GCTGGCGGTG 
CTGACCTGGC AAGGCTGGAT GACGCCCTTG CTGCTTTTGT CGCTGACCTT TCTGATCGGG 
GTCGGACAGG CGATCTACAA CCCGCCCTGG CAGGCCAGCA TGCAGGACCT GGTGCCGCGC 
GACGACCTGC CGGCGGCGGT CTCGCTGAAC TCGGTCGGCT TCAACCTGAT GCGCTCGGTC 
GGTCCGGCGG TGGGCGGGAT CATCACCGCC GCCTTCGGAG CCGCCGCCGC CTTTGCGGTC 
AATGCCGCAA GCTACATCCC GCTGCTGGGC GCGCTCACGC GCTGGCATCC GGTGACGCCG 
CCCCGCGTCA CCACGCCCGA GCCCTTCGTC GCCGCCGTGG GCGCCGGCCT TCGCTATGTG 
GCGCTGTCGC CGAACCTGGT GCGGGTGCTG TCGCGCGGGG CGCTGTTCGG CTTTTCGGCC 
ATCGTCGTCA TGGCGCTGTT GCCGCTGGTG GCCAAGCAGA ACCCCACGGG CGGCTCGCTG 
CTGTTCGGCC TGCTGCTGGG CTGCTTCGGC CTGGGCGCGA TCTGCGGCGC GCTGATCAAC 
CCGCTGGTGC GCGAAAGGCT TGACAACGAG AACGTGGTGC GCGTCGCCTT TGCCGCCTTC 
GGCGCCTCGG CACTGATGCT GGCCCTGACC GAAAGCACCT GGCTGCATGC GCTGGCCATG 
CTGCCGGCGG GCGCAAGCTG GGTGCTGGCG CTGTCGCTCT TCAACGTCAC GGTGCAGCTT 
TCGACGCCGC GCTGGGTGGT GGCGCGGGCG CTGGCGCTTT ACCAGACCGC GGTCTTCGGC 
GGCATGGCGG CGGGCAGCTG GGCCTGGGGT TCGGTCGCCA ACAATTACGA CGTGAACACG 
GCGCTGATCA CGGCCTCGGT GCCGCTGTTC CTGGGCGCGA TGCTGGGGCA CTGGCTGCGC 
ATCCCCGAAT TCGGCACGCT GGACCTCGAC CCGCTCAACC GCTTTCGCGA GCCGGAACTG 
GCGCTGGACC TGCGCGGCCG TTCGGGCCCG ATCATGGTGA TGGTCGATTA CGAGATCGAC 
CAGAAGGACG TGCCAGAATT CCTGCGCCTG ATGGCGCTGC GCCGCAACGT GCGCCGCCGC 
GACGGGGCGC GGAACTGGGC GCTCTTGCGC GACCTGGAGC ATCCCGAGCG CTGGACCGAA 
AGCTATCACA TCGCCACCTG GGACGAATAC GTGCGCCACA ACCTGCGCCG CACCAAGGCC 
GATTTCGAGA CCTACCAGGA CCTGAACAAG CTGCATCGCG GCACCGAGCC GCCCATCGTC 
CACCGCATGA TCGAGCGCCA CACCGTCAGC CTGGACGACG ATGTGCCGCT GATCGGCAAG 
CTGGAAGTGC CCTGA

Protein sequence

MPAPARKSPF APFRHRDFRL LWSATLISNF GGLVQAVGAA WMMTQLTDSA TLIALVQASN 
TLPIMLFALL SGALADIFDR RTLLLGAQVF MAAVSVLLAV LTWQGWMTPL LLLSLTFLIG 
VGQAIYNPPW QASMQDLVPR DDLPAAVSLN SVGFNLMRSV GPAVGGIITA AFGAAAAFAV 
NAASYIPLLG ALTRWHPVTP PRVTTPEPFV AAVGAGLRYV ALSPNLVRVL SRGALFGFSA 
IVVMALLPLV AKQNPTGGSL LFGLLLGCFG LGAICGALIN PLVRERLDNE NVVRVAFAAF 
GASALMLALT ESTWLHALAM LPAGASWVLA LSLFNVTVQL STPRWVVARA LALYQTAVFG 
GMAAGSWAWG SVANNYDVNT ALITASVPLF LGAMLGHWLR IPEFGTLDLD PLNRFREPEL 
ALDLRGRSGP IMVMVDYEID QKDVPEFLRL MALRRNVRRR DGARNWALLR DLEHPERWTE 
SYHIATWDEY VRHNLRRTKA DFETYQDLNK LHRGTEPPIV HRMIERHTVS LDDDVPLIGK 
LEVP