Gene B21_03381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03381
Symbol	yiaN
ID	8112589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3605032
End bp	3606309
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	51%
IMG OID	644849554
Product	hypothetical protein
Protein accession	YP_003001127
Protein GI	251786823
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTGC TGATTTTTCT GGGCTGTCTG TTGGGTGGTA TTGCTATCGG TTTGCCTATT 
GCCTGGGCAC TGTTGTTGTG CGGGGCGGCG TTAATGTTCT GGCTGGACAT GTTTGATGTC 
CAGATCATGG CACAAACGCT GGTGAACGGA GCCGATAGCT TCTCCCTGCT GGCGATTCCG 
TTCTTTGTGC TGGCGGGTGA AATCATGAAT GCGGGCGGCT TGTCAAAACG CATTGTTGAC 
CTGCCGATGA AACTGGTGGG GCATAAACCA GGCGGGCTGG GCTACGTCGG CGTGCTGGCA 
GCTATGATTA TGGCGAGCCT TTCTGGTTCT GCCGTTGCGG ATACCGCCGC CGTTGCCGCT 
CTACTGGTGC CGATGATGCG CAGCGCCAAC TATCCGGTCA ACCGGGCGGC GGGGCTGATT 
GCCTCTGGCG GCATTATCGC GCCAATTATT CCCCCTTCCA TTCCGTTTAT TATCTTCGGC 
GTTTCCAGCG GATTATCCAT CAGTAAGCTG TTTATGGCGG GCATTGCCCC TGGCATGATG 
ATGGGCGCAA CGCTGATGCT TACCTGGTGG TGGCAGGCCA GTCGCCTTAA TTTACCCCGC 
CAGCAAAAAG CAACGATGCA GGAAATCTGG CACTCTTTTG TCTCCGGTAT CTGGGCGCTG 
TTTCTTCCAG TCATCATTAT TGGCGGGTTT CGCTCCGGTC TGTTTACCCC TACCGAAGCC 
GGGGCCGTTG CTGCTTTCTA TGCGCTGTTT GTCGCCACAG TTATTTACCG TGAAATGACC 
TTCGCCACAC TTTGGCATGT ACTCATTGGC GCGGCGAAAA CCACCTCAGT GGTTATGTTT 
CTGGTGGCCT CGGCACAAGT TTCCGCCTGG CTGATTACCA TTGCTGAACT GCCGATGATG 
GTTTCTGATT TACTGCAACC GTTGGTCGAT TCACCGCGTC TGCTGTTTAT CGTCATTATG 
GTGGCTATCC TGATTGTCGG CATGGTCATG GATTTAACGC CGACGGTATT AATTCTTACC 
CCGGTATTAA TGCCTTTAGT TAAAGAGGCA GGAATCGATC CGATTTATTT CGGTGTCATG 
TTTATCATTA ACTGCTCAAT CGGCTTAATT ACACCGCCTA TCGGTAATGT ACTTAACGTT 
ATTTCAGGGG TGGCAAAACT CAAATTCGAT GATGCAGTCA GAGGCGTTTT CCCTTACGTC 
CTGGTTTTAT ATTCATTATT AGTCGTATTT GTTTTTATTC CCGATCTCAT CATCCTCCCT 
TTGAAATGGA TTAATTAA

Protein sequence

MAVLIFLGCL LGGIAIGLPI AWALLLCGAA LMFWLDMFDV QIMAQTLVNG ADSFSLLAIP 
FFVLAGEIMN AGGLSKRIVD LPMKLVGHKP GGLGYVGVLA AMIMASLSGS AVADTAAVAA 
LLVPMMRSAN YPVNRAAGLI ASGGIIAPII PPSIPFIIFG VSSGLSISKL FMAGIAPGMM 
MGATLMLTWW WQASRLNLPR QQKATMQEIW HSFVSGIWAL FLPVIIIGGF RSGLFTPTEA 
GAVAAFYALF VATVIYREMT FATLWHVLIG AAKTTSVVMF LVASAQVSAW LITIAELPMM 
VSDLLQPLVD SPRLLFIVIM VAILIVGMVM DLTPTVLILT PVLMPLVKEA GIDPIYFGVM 
FIINCSIGLI TPPIGNVLNV ISGVAKLKFD DAVRGVFPYV LVLYSLLVVF VFIPDLIILP 
LKWIN