Gene Plav_2384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2384
Symbol
ID	5456480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	2573606
End bp	2575255
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	64%
IMG OID	640877960
Product	protein of unknown function DUF894 DitE
Protein accession	YP_001413651
Protein GI	154252827
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.123744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.932575
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGACG CGGCAAAAGC GGAAAAAGAT GCGGTCTCCG CCTGGGCGCC CTTCGGGCAC 
GCCGCCTTTG CCGTTCTCTG GACAGCGACG GTCGTTTCCA ACATCGGCAC CTGGATGCAC 
GACGTCGCCT CCGGCTGGCT GATGACCTCG CTTTCGCCGT CGCCCTTGAT GGTGGCGCTG 
GTGCAGGCGG CGACCACGGC GCCGATTTTC CTCTTCGCGC TTTCCGCCGG CGCGATGGCC 
GATCTCGTGG ACCGGCGTCG CTTGCTCATC GTGATCATGA CCGCGCTCGT CATCGTCACG 
CTGGGCCTCG GCGTGCTGGT GCTACTTGGC CTCGTCAATG CATGGATGCT GCTGCTTTTC 
ACCTTCCTGT CCGGGGCAGG GGCTGCCTTT GTTGCACCGG CATGGCAGGC GATCGTCCCT 
CAACTCGTTC CAAGACCCGA TCTTTCGTCG GCGGTGGCGC TCAACAGCGT CGGGATCAAC 
ATAAGCCGCG CCATAGGTCC GGCGCTTGCT GGCCTCATCA TTGCCTCTTT CGGTATCGCA 
TGGCCCTATA TGCTCAACGC CCTGAGCTAT GTGATCGTCA TCGGCGCACT TCTGTGGTGG 
CGACCGCCGC CGCAGCCGAA AAGCGACCTG CCTGTCGAAC GCTTCTGGAG CGCCATCCGC 
TCGGGTCTGC GCTATGTCCG CGCGAGCAGC CCCATGCGCG CCACGCTGGT TCGCGCTATA 
GCCTTCTTCC TCTTCGCCAG TGCCTATTGG GCGCTGCTTC CCATTATCGC CCGCCGGGAA 
TTGCAGGGGG GGCCAGAGCT TTACGGTCTC ATGCTCGCTT CCGTCGGCAT CGGGGCCGTC 
AGCGGCGCGC TCTTTCTGCC GCGCCTGAAG AAGAGCATGG GGCCGGATAC TCTCGTCGCC 
GCCGGAACCG CGGGAACGGC GCTTGTTCTC GCCGTCTTCG CTCTCGTCGC CATTCCGGCA 
GCCGCGATCG CCGTCAGCTT CATCGCGGGC GCTTCATGGA TCATGGTGCT CTCCAGCCTC 
AATGTATCGG CGCAGATGGT CCTGCCGGAT TGGGTTCGCG CTCGCGGCCT TTCGGTCTTC 
ATCACCGTTT TTTTCGGCTC TATGACTCTG GGAAGCATGA TCTGGGGACA GACCGCCTCG 
CTGCTCGGCG TTCCGTTCAC ATTGCTTTTG GCCGCCGCCG GTTCGCTGCT GGGCGCGGTT 
CTCTCCTGGC CCTTCAAGCT GCGGCAGGGC GATGCGCTCG ATCTTTCGCC CTCCATGCAT 
TGGCCCGCAC CGGTTGTGGC GGGCGATGTA GCGCATGATC GCGGGCCCGT GATGATCACC 
GTCGAATATC GGATCGCACC GGCAACCGCC GCTGATTTTG CCGCCGCCAT GAAGGATCTC 
CGTGCCGCGC GCCGCCGCGA CGGGGCTTAT GCCTGGGGTC TTTTCGAAGA TGTCGCCATG 
CCGGGCCGCT ATATCGAATA TTTCACCGAG GAATCATGGC TCGCCCATCT GCGCCATCAT 
GAGCGTGTGG CGGAGTCCGA TCGCCTTCTC CAGCAGAAAG TCCGCGCCTT CCATCTGGGT 
CCGGACGATC CCGTAGTCAC TCATTATCTC GCGCCGGCGC CGGGCGCCGC TGTGGTGCCT 
CCACCGCCGC GTGACGGAGA GTTGCAATGA

Protein sequence

MTDAAKAEKD AVSAWAPFGH AAFAVLWTAT VVSNIGTWMH DVASGWLMTS LSPSPLMVAL 
VQAATTAPIF LFALSAGAMA DLVDRRRLLI VIMTALVIVT LGLGVLVLLG LVNAWMLLLF 
TFLSGAGAAF VAPAWQAIVP QLVPRPDLSS AVALNSVGIN ISRAIGPALA GLIIASFGIA 
WPYMLNALSY VIVIGALLWW RPPPQPKSDL PVERFWSAIR SGLRYVRASS PMRATLVRAI 
AFFLFASAYW ALLPIIARRE LQGGPELYGL MLASVGIGAV SGALFLPRLK KSMGPDTLVA 
AGTAGTALVL AVFALVAIPA AAIAVSFIAG ASWIMVLSSL NVSAQMVLPD WVRARGLSVF 
ITVFFGSMTL GSMIWGQTAS LLGVPFTLLL AAAGSLLGAV LSWPFKLRQG DALDLSPSMH 
WPAPVVAGDV AHDRGPVMIT VEYRIAPATA ADFAAAMKDL RAARRRDGAY AWGLFEDVAM 
PGRYIEYFTE ESWLAHLRHH ERVAESDRLL QQKVRAFHLG PDDPVVTHYL APAPGAAVVP 
PPPRDGELQ