Gene Shewmr4_1975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1975
Symbol
ID	4252548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2348667
End bp	2349938
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	46%
IMG OID	638118587
Product	inner membrane transport protein YdhC
Protein accession	YP_734105
Protein GI	113970312
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00432346
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.238152
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGT CTAGTAATAT CTTTGTAAAT ATGAAGTTTT TTATATTCTT ATTCTATTTG 
GCATTATTAA GCATGTTAGG CTTTATTGCC ACTGACATGT ATTTGCCTGC TTTCAAAGCA 
ATTGAAAGTT CGTTCAATTC TTCACCGTCT CAAGTAGCAA TGTCGCTCAC CTGTTTTTTG 
GCTGGTTTAG CCTTAGGGCA ACTGATTTAT GGCCCCTTGG TCAGTAAACT CGGCAAACGT 
TATGCTCTTA TCCTCGGCCT TGGCATTTTT GCGCTCGCCA GTGTGGCCAT CGCCAATAGC 
GACTCGATAC TGATGTTAAA CATCGCTCGC TTCTTCCAAG CCGTTGGCGC CTGTAGTGCA 
GGGGTCATCT GGCAAGCGAT TGTGGTCGAG CAATATGATG CCGAAAAAGC GCAGGGGATT 
TTCAGTAACA TTATGCCGTT AGTGGCATTA TCACCCGCAT TAGCCCCCAT CCTTGGCGCT 
TATATTCTGA ACGATTTTGG ATGGCGTGCA ATCTTTATCT CATTGTGTGT GATTGCCTTT 
TTATTGGTGT TGATGACCTT ATACTTCGTG CCGAGCCATG CAGAGCATCA GGATGCTAAG 
CCAAGCGCGG TTTCCTACGG CAAGATTTTG AAAAATACCC GTTACCTTGG CAATGTGGTG 
ATTTTTGGTG CCTGTTCGGG TGCGTTTTTC GCATATCTTA CTGTATGGCC GATTGTGATG 
GAGCAACACG GCTATCAGGC AACAGAGATT GGGCTGAGCT TTATTCCGCA AACCATCATG 
TTTATTGTGG GCGGATACGC AAGCAAGTTA TTGATAAAAC GCATTGGTGC CGACCGTACA 
CTCAACGTAT TGCTGTCCAT TTTTGGACTC TGCGTTATCT CGATTGTGTT TTTCACCTTA 
TTAATGAAGG CGGAAACCAT TTTCCCACTG CTGATTTCCT TCTCGATACT CGCAGCGGCG 
AACGGGGCGG TTTATCCCAT TGTGGTGAAC AGTGCTTTGC AGCAATTCAC TCAAAATGCG 
GCTAAGGCGG CAGGATTACA GAACTTTTTG CAAATCACCA TCGCCTTTGG CGCCTCAAGT 
TTAGTCGCAC TCTGGGCAAG TTCAGGAGAA GTCGCCATAG GTTGGGGCAT TCTGAGCTGT 
TCATTAGTGG TGATCTTGGG TTACCTGTTA AAAACCGAAC AAACTTGGGC TGATTTTGCT 
AAACACTTTA CTGCGCCAGA TCCTGCTCGT CTTGGGATCA ATGCAGATAC GAAGCAAAAT 
CAAGCAGATT GA

Protein sequence

MKTSSNIFVN MKFFIFLFYL ALLSMLGFIA TDMYLPAFKA IESSFNSSPS QVAMSLTCFL 
AGLALGQLIY GPLVSKLGKR YALILGLGIF ALASVAIANS DSILMLNIAR FFQAVGACSA 
GVIWQAIVVE QYDAEKAQGI FSNIMPLVAL SPALAPILGA YILNDFGWRA IFISLCVIAF 
LLVLMTLYFV PSHAEHQDAK PSAVSYGKIL KNTRYLGNVV IFGACSGAFF AYLTVWPIVM 
EQHGYQATEI GLSFIPQTIM FIVGGYASKL LIKRIGADRT LNVLLSIFGL CVISIVFFTL 
LMKAETIFPL LISFSILAAA NGAVYPIVVN SALQQFTQNA AKAAGLQNFL QITIAFGASS 
LVALWASSGE VAIGWGILSC SLVVILGYLL KTEQTWADFA KHFTAPDPAR LGINADTKQN 
QAD