Gene Shewmr4_1792 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1792
Symbol
ID	4252366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2127505
End bp	2128692
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	52%
IMG OID	638118403
Product	aromatic amino acid transporter
Protein accession	YP_733923
Protein GI	113970130
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00837] aromatic amino acid transport protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAAA ATAAATTTTT CGGTAGTTTG CTACTGATTG CAGGCACCAC CATTGGCGCG 
GGTATGCTCG CACTCCCTAT CGCCTCGGCA GGACTCGGTT TTGGTGTATC GAGCATCATT 
ATGTTGCTCC TCTGGGCGCT GATGGCCTAC ACCGCCCTGC TGATGGTTGA AATCCATCAA 
TTTGCCCCGA GTGATGCGAG CCTGAACCAA TTAGCGCGCA CGCTTTTGGG CGCTAAGGGC 
CAAGTGATTG CCAGTGTTGC CCTGATGTTT TTACTCTACG CCCTGTGCGC CGCCTATATC 
GCGGGTGGCG GCGAGCAAGT CAATCAAAAG CTCAATGCTT GGTTAGGATT AAATCTTCCG 
CCACAGGCGG GCGCCATCTT CTTTACCCTG TTAGTCAGCA CCATTGTCGG CTTAGGCACC 
CATTGTGTCG ATTTGATTAA TCGCGTGCTC TTTAGTTTGA AAATCATTGC GTTAATCCTA 
ATGCTGGCTT TATTACTGCC ACAGGTTGAA GGCACACATT TACTCGAACT GCCGCTAGAG 
CAAGGGCTTA TCGTGTCAGC CATACCTGTG ATTTTTACCT CCTTTGGTTT TCATGGTTCG 
ATTCCATCCG TGGTGCGCTA CTTAGGCGTT GAGGTAAAAA GCCTGCGTAA AATCATGCTG 
CTCGGCTCGG CGTTACCACT GCTCATTTAC CTGCTGTGGC AACTGGGCAG TCAAGGCGTA 
CTCAGTCAAA GCCAACTGAT GACGAATCAG AGTCTTTCGG GCTTTATCAA TCAGTTAGCC 
AGTGTATTGC ACAGCCAATA CTTAAGTTCT GCCATCAGTG TATTTGCCGA TCTGGCGCTG 
GCCACCTCCT TTTTAGGGGT GAGCCTCGGT CTGTTTGACT TTATGGCGGC TAACTTAAGG 
CAGCAGGATA ATGCCGTGGG TCGCAGTGTT ACCGCCGCCA TTACCTTCGT ACCTCCTCTG 
GGGTTTGCCC TCTTTTACCC GCAGGGATTT ATTACCGCCC TCGGTTATGC GGCAATCGCC 
CTCGTGATCC TCGCGATTTT TTTACCCGTG ACCATGGTGT GGGTTCAAAG ACAAACGCGC 
GATAAGGCGA ATCTGCCACA GGGTTACCGC GTCGCAGGGG GGAAGCTCGG TTTACTGTTG 
GCAATGCTCT GCGGAGTGGC CGTGATTGGC GCTCAGCTCT TGGGATAA

Protein sequence

MTQNKFFGSL LLIAGTTIGA GMLALPIASA GLGFGVSSII MLLLWALMAY TALLMVEIHQ 
FAPSDASLNQ LARTLLGAKG QVIASVALMF LLYALCAAYI AGGGEQVNQK LNAWLGLNLP 
PQAGAIFFTL LVSTIVGLGT HCVDLINRVL FSLKIIALIL MLALLLPQVE GTHLLELPLE 
QGLIVSAIPV IFTSFGFHGS IPSVVRYLGV EVKSLRKIML LGSALPLLIY LLWQLGSQGV 
LSQSQLMTNQ SLSGFINQLA SVLHSQYLSS AISVFADLAL ATSFLGVSLG LFDFMAANLR 
QQDNAVGRSV TAAITFVPPL GFALFYPQGF ITALGYAAIA LVILAIFLPV TMVWVQRQTR 
DKANLPQGYR VAGGKLGLLL AMLCGVAVIG AQLLG