Gene B21_01856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01856
Symbol	araH
ID	8114287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1927010
End bp	1927999
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	51%
IMG OID	644848075
Product	hypothetical protein
Protein accession	YP_002999648
Protein GI	251785344
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTCTT CTGTTTCTAC ATCGGGGTCT GGCGCACCTA AGTCGTCATT CAGCTTCGGG 
CGTATCTGGG ATCAGTACGG CATGCTGGTG GTGTTTGCGG TGCTCTTTAT CGCCTGTGCC 
ATTTTTGTCC CAAATTTTGC CACCTTCATT AATATGAAAG GGTTGGGCCT GGCAATTTCC 
ATGTCGGGGA TGGTGGCTTG TGGCATGTTG TTCTGCCTCG CTTCCGGTGA CTTTGACCTT 
TCTGTCGCCT CCGTAATTGC CTGTGCGGGT GTCACCACGG CGGTGGTTAT TAACCTGACT 
GAAAGCCTGT GGATTGGCGT GGCAGCGGGG TTGTTGCTGG GCGTTCTCTG TGGCCTGGTC 
AATGGCTTTG TTATCGCCAA ACTGAAAATA AATGCTCTGA TCACGACATT GGCAACGATG 
CAGATTGTTC GAGGTCTGGC GTACATCATT TCAGACGGTA AAGCGGTCGG TATCGAAGAT 
GAAAGCTTCT TTGCCCTTGG TTACGCCAAC TGGTTCGGTC TGCCTGCGCC AATCTGGCTC 
ACCGTCGCGT GTCTGATTAT CTTTGGTTTG CTGCTGAATA AAACCACCTT TGGTCGTAAC 
ACCCTGGCGA TTGGCGGGAA CGAAGAGGCC GCGCGTCTGG CGGGTGTACC GGTTGTTCGC 
ACCAAAATTA TTATCTTTGT TCTCTCAGGC CTGGTATCAG CGATAGCCGG AATTATTCTG 
GCTTCACGTA TGACCAGTGG GCAGCCAATG ACGTCGATTG GTTATGAGCT GATTGTTATC 
TCCGCCTGCG TTTTAGGTGG CGTTTCTCTG AAAGGTGGCA TCGGAAAAAT CTCATATGTG 
GTGGCGGGTA TCTTAATTTT AGGCACCGTG GAAAACGCCA TGAACCTGCT TAATATTTCT 
CCTTTCGCGC AGTACGTGGT TCGCGGCTTA ATCCTGCTGG CAGCGGTGAT CTTCGACCGT 
TACAAGCAAA AAGCGAAACG CACTGTCTGA

Protein sequence

MMSSVSTSGS GAPKSSFSFG RIWDQYGMLV VFAVLFIACA IFVPNFATFI NMKGLGLAIS 
MSGMVACGML FCLASGDFDL SVASVIACAG VTTAVVINLT ESLWIGVAAG LLLGVLCGLV 
NGFVIAKLKI NALITTLATM QIVRGLAYII SDGKAVGIED ESFFALGYAN WFGLPAPIWL 
TVACLIIFGL LLNKTTFGRN TLAIGGNEEA ARLAGVPVVR TKIIIFVLSG LVSAIAGIIL 
ASRMTSGQPM TSIGYELIVI SACVLGGVSL KGGIGKISYV VAGILILGTV ENAMNLLNIS 
PFAQYVVRGL ILLAAVIFDR YKQKAKRTV