Gene Plav_1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_1411
Symbol
ID	5453715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	1542843
End bp	1544492
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	61%
IMG OID	640876984
Product	general substrate transporter
Protein accession	YP_001412688
Protein GI	154251864
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.966407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAAG ACAGGACGGC GCGCATGACG CCGGAAGAGC GGCGGGTGAT TTTCGCCTCT 
TCGCTCGGCA CGGTGTTCGA GTGGTACGAC TTTTATTTGT ACGGCTCGCT CGCGGCGATC 
ATCTCCGTGC AGTTTTTCTC CGGCGTCAAT CCGACGGCGG GTTTCATCTT CGCGCTGCTT 
GCTTTTGCCG CCGGCTTTGC GGTCCGTCCC TTCGGCGCCA TCGTCTTTGG GCGTCTCGGC 
GATCTTGTGG GTCGCAAATA CACGTTCCTG GTCACCATCC TCATCATGGG CGTGGCGACC 
TTCATCGTCG GTCTGCTGCC AAATTACGAG ACCATCGGCT TTGCCGCGCC GGCTATCCTG 
ATCGCCTTGC GGCTTGCGCA GGGCCTCGCA CTTGGCGGCG AATATGGCGG CGCGGCCATC 
TATGTCGCGG AACATGCGCC TCATGCGAAG CGCGGCGCCT ATACGTCATG GATACAGACC 
ACAGCGACGC TTGGTCTCTT CCTTTCGCTT CTCGTCATTC TCGGTTGCCG TCTTTCGATG 
GACAAGGAGA GCTTCGAGAG CTGGGGCTGG CGTATTCCGT TCCTTCTTTC CATCGTCCTG 
CTTGGCATTT CCGTCTGGAT AAGGCTCCGT CTCAACGAGT CGCCGCTGTT CCAGCGGATG 
AAGGCGGAAG GGACGCTGTC CAAGGCGCCG CTCACGGAAT CCTTCGCGCG CTGGGGTAAT 
CTCAAGATCG TCATCATCGC CCTGGTCGGC CTTACAGCCG GACAAGCCGT CGTCTGGTAT 
ACGGGGCAGT TCTATGCGCT CTTCTTCCTG ACGCAGGTGC TGAAGGTCGA CAGCCAGACA 
GCGAACATCC TTATCGGCGG TGCGCTGCTT GTCGGCGTTC CCTTCTTCGT AATTTTCGGT 
GCCTTGTCTG ACAGGATCGG GCGCAAGCCG ATCATTCTGG CGGGCTGCCT GCTTGCGGCG 
TTGACCTATT TCCCTCTCTT CTCCGCGCTC ACGCACTACG CCAACCCCGC ACTGGAAGCC 
GCGCAGGAGA GGGCACCCGT CGTCGTCGTG GCCGACAGCG CCGCCTGTTC CTTCCAGTTC 
AATCCGGTCG GTACCTCGGC CTTCACCACG CCCTGCGATG TCGCAAAGAG CGAACTCGCA 
AAACGTGGCA TCCCCTATTC GAATGCGGAG CTCAGAGCAG GGGAGGAAAC GCGCATCGAG 
GTAGGCTCTA TCGCCGTTCC ATCATTTGAC GCCAGCGATG ACGCCGGTGG TGAGGCGCGC 
GCCGCTTTCG CTGCGGCGCT GACGCTTGCC TTGACGGAAG CCGGCTATCC GCTCGCGGCC 
GATCTCGCCG CCATCAACTA TCCGATGGTG GTGCTGATCC TCTTCATCCT CGTTCTCTAT 
GTGACGATGG TCTATGGGCC GATCGCGGCG ATGCTGGTCG AGCTTTTCCC GACGCGCATC 
CGCTATACGT CGATGTCGCT TCCGTATCAC ATCGGCAATG GCTGGTTCGG CGGCTTCCTG 
CCGACGGTCT CTTTCGCCAT CGTGGCGGCG ACGGGAAACC TCTATTCAGG TCTTTGGTAT 
CCGGTCGCCA TCGCCGCCAT GACCTTTGTC GTGGGGCTCA TCTTCGTGCC CGAAACGAAA 
GACAGGGCGC TGCATCCGGA AGAAGGCTGA

Protein sequence

MAEDRTARMT PEERRVIFAS SLGTVFEWYD FYLYGSLAAI ISVQFFSGVN PTAGFIFALL 
AFAAGFAVRP FGAIVFGRLG DLVGRKYTFL VTILIMGVAT FIVGLLPNYE TIGFAAPAIL 
IALRLAQGLA LGGEYGGAAI YVAEHAPHAK RGAYTSWIQT TATLGLFLSL LVILGCRLSM 
DKESFESWGW RIPFLLSIVL LGISVWIRLR LNESPLFQRM KAEGTLSKAP LTESFARWGN 
LKIVIIALVG LTAGQAVVWY TGQFYALFFL TQVLKVDSQT ANILIGGALL VGVPFFVIFG 
ALSDRIGRKP IILAGCLLAA LTYFPLFSAL THYANPALEA AQERAPVVVV ADSAACSFQF 
NPVGTSAFTT PCDVAKSELA KRGIPYSNAE LRAGEETRIE VGSIAVPSFD ASDDAGGEAR 
AAFAAALTLA LTEAGYPLAA DLAAINYPMV VLILFILVLY VTMVYGPIAA MLVELFPTRI 
RYTSMSLPYH IGNGWFGGFL PTVSFAIVAA TGNLYSGLWY PVAIAAMTFV VGLIFVPETK 
DRALHPEEG