Gene Shewmr4_3026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3026
Symbol
ID	4253597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3618198
End bp	3619373
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	51%
IMG OID	638119668
Product	aromatic amino acid permease
Protein accession	YP_735154
Protein GI	113971361
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00837] aromatic amino acid transport protein

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGGCT CGATAGCCAT TGTCGCGGGG ACCGCCATTG GCGCGGGAAT GTTAGCCTTA 
CCCTTAGCCA CGGCCGCCTT AGGCATGGTG CCAGCCATTT TGTTAATGGT GGTGATTTGG 
GGCTTGTCAG CCTATACCTC ATTGTTAATG CTTGAGATTA ACCTGCGCTC AGGCGTTGGT 
GATAACGTCC ACGCCATCAC GGGCAAACTC CTCGGCAAGA AAGGCCAAAT GGTGCAAGGC 
GCCTCCTTTC TCAGTTTACT CTTTGCCTTA ACGGCGGCGT ATTTGACGGG CGGTTCATCG 
CTGTTAGTGC TTAAAGCCAA AAATATGTTC GACCTCGTGT TAGATAACCA ACTGGCGGTC 
GTGCTGTTTA CCTTAGTGCT GGGTGGATTT GCGGCCTTAG GAGTCGCTTG GGTTGATAAA 
GCCTCGCGCT TCTTGTTTTC GCTGATGATT TTATTGCTGA TTGTGGTCGT GCTGTTTTTA 
TTACCGGAAG TCAGTATCTC GAGTATGGCA ACCAGTGCAG TGGCCGAGTC CATGACCAGC 
AGTTGGATGG CGGCGATTCC TGTGGTGTTT ACTTCTTTTG GTTTCCACGT GTGTATCGCC 
ACCTTAGTGC GTTATTTGGA TGGCAATGCT GTTTCGCTGC GCAAAGTATT ATTAATCGGT 
TCAACCATTC CGCTCGCTTG TTATATCTTC TGGTTATTGG TGACCTTAGG CACAGTGGGT 
GGCAACGAAG TTAGCAGCTT TAATGGCTCT TTACCTGCGC TGATCAGTGC ATTACAAGAG 
ATTGCCCACA CGCCTTGGAT CAGCAAATGT ATTTCGCTGT TTGCGGATTT AGCCTTAATC 
ACCTCTTTCC TCGGGGTCAC CTTAAGCCTG TATGATTTTG TGGCCGAACT GACCCGCGCA 
AAGAAGACCT TCCTCGGCCG CGCCCAAACC TGGCTGTTAA CCTTTGTGCC GCCGCTGTTA 
TGTGCGCTCT ATGTCCCCGA AGGTTTTGTT GCGGTATTAG GCTTTGCAGC CGTGCCGCTG 
GTGGTGATGA TTATCTTCCT GCCGATCGTG ATGGCACTGC GTCAGCGCCA AGCCACGCCG 
CAGGGATACC AAGTGTCTGG CGGCACATTT GCCCTCGGAA TTGCGGGTTT GCTAGGCGCA 
GTGATTATCG GCGCTCAGTT ATTTGTCGCG CTGTAA

Protein sequence

MLGSIAIVAG TAIGAGMLAL PLATAALGMV PAILLMVVIW GLSAYTSLLM LEINLRSGVG 
DNVHAITGKL LGKKGQMVQG ASFLSLLFAL TAAYLTGGSS LLVLKAKNMF DLVLDNQLAV 
VLFTLVLGGF AALGVAWVDK ASRFLFSLMI LLLIVVVLFL LPEVSISSMA TSAVAESMTS 
SWMAAIPVVF TSFGFHVCIA TLVRYLDGNA VSLRKVLLIG STIPLACYIF WLLVTLGTVG 
GNEVSSFNGS LPALISALQE IAHTPWISKC ISLFADLALI TSFLGVTLSL YDFVAELTRA 
KKTFLGRAQT WLLTFVPPLL CALYVPEGFV AVLGFAAVPL VVMIIFLPIV MALRQRQATP 
QGYQVSGGTF ALGIAGLLGA VIIGAQLFVA L