Gene PC1_3901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PC1_3901
Symbol
ID	8134888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pectobacterium carotovorum subsp. carotovorum PC1
Kingdom	Bacteria
Replicon accession	NC_012917
Strand	-
Start bp	4388115
End bp	4389365
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	59%
IMG OID	644867208
Product	major facilitator superfamily MFS_1
Protein accession	YP_003019452
Protein GI	253690262
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTGA GTGGGCAGGT GGCGTTCATC ATCCACTTTA TGTTTGTCGT ACAACTGGTG 
GCGATGGGGG CGATGGAGAT GAGCGGGCCG TTTTGGCCGC TGCATCTGGA AAGTATGTCG 
TCCGGTGCGG AACTGAGTAT CGCGGGGATT GCCGTGTACA TCGGGCCGAT GCTGGGCATT 
ATGCTGACCA GCGCCTTCTG GGGACGAATG GGCGATCGGC TGGGCAATAA AGCCATGATG 
ATCCGCGCGC TGTTCGGGCT AGCGTTAACC CAGCTTGGGC TGGCGTGGGC CAATGACATC 
TGGACGATCG TCGCGCTGCG TTTTATTCAG GGCGCCTGTG CGGGGTATAT CGCGCCCGCG 
CAGGCCTACG GTGTCGCGGT CGTCAGTCCG TTACAGCGTA CGCGGCTGTT CGCCTGGCTT 
CAGGTGTCTA CTAACGTGGG ATCGCTGCTG GGGGCGATTG TCGGCGGGCT GATCCTCGAC 
TACCTGAACT TCTTCTGGAT CAACCTGAGC GCCGCGATCC TGTGCGCGCT GTGTGGCATT 
ACCGTGGCGC TGTTCCTGCC GCATGTCGCC CCCGATGTCC CTGCGGTTCC GCCTGCGGAT 
GCACAGGAGA AAAGCACACC GCGCAGTCGG CTTTGGGCGC TGTCGCCGAT TTCCGGCCTG 
CTGCTGATTT CCGGCCTGTT GCTGGCCAGC CGGATGATTC CGCAAACGCC GTTTTCCCTG 
TATATGGATG GCATTTTTCA GGTGGATAAA TGGATTATCG GCCTGTGCTA TGGCTTGCAG 
GCGACCGGTG TGATTGTTTC TGCATCGCTG TGGGCGCGCT ATTTTGAAAA CCTCTCGCTG 
TCGCAGACGC TGAGCCGCTT GTGTGTGGTT ATGCTGGCCT GCGCCATCGT CACATTGACG 
GCCGCCACGA TCCTGAATAT CGCGATTTTC ATCCCACTTT ATTTCCTGTG GGGCGTCCTG 
CTGGGGGCGA CGACGCCGGT TCTGATGGCG CTGATTTCTC GTGCGGCTGG TGCCGGACAG 
CAGGGTTACA TACTCGGTGT GGCGCAAAGC GTCAGCCAGT TTGCCTCGAT TCTGGGCATT 
GCTTTGGGCG GATTGGTGCT CTACTCCCCC GGACTACGTT CGCTATTCTT CTGCGTTGGT 
GCCGCGTATC TGGTGACCTT CCTGGTCTCG CTGATGCTGC TACGACACCT GCGGAAACAG 
GCGGAAAAAC ATGGCTCTCT CTCGACGAAG GGAAATATCG AAAATGTGTA A

Protein sequence

MRLSGQVAFI IHFMFVVQLV AMGAMEMSGP FWPLHLESMS SGAELSIAGI AVYIGPMLGI 
MLTSAFWGRM GDRLGNKAMM IRALFGLALT QLGLAWANDI WTIVALRFIQ GACAGYIAPA 
QAYGVAVVSP LQRTRLFAWL QVSTNVGSLL GAIVGGLILD YLNFFWINLS AAILCALCGI 
TVALFLPHVA PDVPAVPPAD AQEKSTPRSR LWALSPISGL LLISGLLLAS RMIPQTPFSL 
YMDGIFQVDK WIIGLCYGLQ ATGVIVSASL WARYFENLSL SQTLSRLCVV MLACAIVTLT 
AATILNIAIF IPLYFLWGVL LGATTPVLMA LISRAAGAGQ QGYILGVAQS VSQFASILGI 
ALGGLVLYSP GLRSLFFCVG AAYLVTFLVS LMLLRHLRKQ AEKHGSLSTK GNIENV