Gene B21_02979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02979
Symbol	mtr
ID	8114025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3172279
End bp	3173523
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	53%
IMG OID	644849164
Product	hypothetical protein
Protein accession	YP_003000737
Protein GI	251786433
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00837] aromatic amino acid transport protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAC TAACCACCAC CCAAACGTCA CCGTCGCTGC TTGGCGGCGT GGTGATTATC 
GGCGGCACCA TTATTGGCGC AGGGATGTTT TCTCTGCCAG TGGTCATGTC CGGGGCGTGG 
TTTTTCTGGT CAATGGCGGC GCTGATCTTT ACCTGGTTCT GTATGCTGCA TTCCGGCTTG 
ATGATTCTGG AAGCTAACCT GAATTACCGA ATCGGTTCGA GTTTTGACAC CATCACCAAA 
GATTTGCTGG GCAAAGGCTG GAACGTGGTC AACGGTATTT CCATTGCCTT TGTGCTCTAT 
ATCCTGACCT ATGCCTATAT TTCTGCCAGT GGTTCAATTC TGCATCACAC CTTCGCAGAG 
ATGTCGCTAA ACGTCCCGGC ACGGGCGGCG GGTTTTGGTT TTGCACTGCT GGTAGCGTTT 
GTGGTGTGGT TGAGTACTAA GGCCGTCAGC CGCATGACGG CGATTGTGCT GGGGGCGAAA 
GTCATTACCT TCTTCCTCAC CTTTGGCAGC CTGTTGGGGC ATGTGCAGCC TGCGACATTG 
TTCAACGTTG CAGAAAGCAA TGCATCTTAT GCGCCGTATC TGCTGATGAC ATTGCCGTTC 
TGCCTGGCGT CGTTTGGTTA TCACGGTAAC GTGCCAAGCC TGATGAAGTA TTACGGCAAA 
GATCCGAAAA CCATCGTGAA ATGCCTGGTG TACGGTACGC TGATGGCACT GGCGCTGTAT 
ACCATCTGGT TGCTGGCGAC GATGGGCAAC ATTCCTCGTC CGGAGTTTAT TGGCATCGCC 
GAGAAGGGCG GTAACATTGA TGTGCTGGTA CAGGCATTAA GTGGCGTGCT GAACAGCCGT 
AGCCTGGACC TTCTGCTGGT CGTGTTCTCA AACTTTGCGG TAGCGAGTTC GTTCCTTGGC 
GTAACGCTGG GTTTGTTTGA CTATCTGGCA GATCTGTTTG GTTTCGATGA CTCAGCTGTG 
GGCCGCTTGA AAACGGCATT GCTGACCTTT GCCCCGCCAG TTGTGGGGGG GCTGCTGTTC 
CCGAACGGAT TCCTGTACGC CATTGGTTAT GCTGGTTTAG CGGCTACCAT CTGGGCGGCA 
ATTGTTCCGG CGCTGTTAGC CCGTGCATCG CGTAAACGCT TTGGCAGCCC GAAATTCCGC 
GTCTGGGGTG GCAAGCCGAT GATTGCGCTG ATTCTGGTGT TTGGCGTCGG CAACGCACTG 
GTGCATATTT TATCGAGCTT TAATTTACTG CCGGTGTATC AGTAA

Protein sequence

MATLTTTQTS PSLLGGVVII GGTIIGAGMF SLPVVMSGAW FFWSMAALIF TWFCMLHSGL 
MILEANLNYR IGSSFDTITK DLLGKGWNVV NGISIAFVLY ILTYAYISAS GSILHHTFAE 
MSLNVPARAA GFGFALLVAF VVWLSTKAVS RMTAIVLGAK VITFFLTFGS LLGHVQPATL 
FNVAESNASY APYLLMTLPF CLASFGYHGN VPSLMKYYGK DPKTIVKCLV YGTLMALALY 
TIWLLATMGN IPRPEFIGIA EKGGNIDVLV QALSGVLNSR SLDLLLVVFS NFAVASSFLG 
VTLGLFDYLA DLFGFDDSAV GRLKTALLTF APPVVGGLLF PNGFLYAIGY AGLAATIWAA 
IVPALLARAS RKRFGSPKFR VWGGKPMIAL ILVFGVGNAL VHILSSFNLL PVYQ