Gene EcHS_A2399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2399
Symbol	arnC
ID	5592530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2407858
End bp	2408826
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	50%
IMG OID	640921524
Product	undecaprenyl phosphate 4-deoxy-4-formamido-L-arabinose transferase
Protein accession	YP_001459058
Protein GI	157161740
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	0.911848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAA TCCACCCTGT TAAGAAAGTC TCGGTGGTTA TTCCCGTTTA TAACGAGCAG 
GAAAGCTTAC CGGAATTAAT CAGGCGCACC ACCACAGCCT GTGAATCGTT GGGGAAAGAG 
TATGAGATCC TGCTGATTGA TGACGGCAGT AGCGATAATT CCGCGCATAT GCTGGTCGAA 
GCCTCACAAG CGGAGAACAG CCATATTGTG TCTATTTTGC TTAACCGCAA TTACGGGCAA 
CATTCAGCGA TTATGGCGGG ATTCAGTCAC GTTACTGGCG ACTTAATTAT TACCCTTGAT 
GCCGATCTCC AGAATCCGCC AGAAGAAATC CCCCGCCTGG TGGCAAAAGC CGATGAAGGT 
TACGACGTGG TTGGGACTGT ACGCCAGAAC CGCCAGGACA GCTGGTTTCG TAAAACCGCT 
TCGAAGATGA TTAACCGGCT TATTCAGCGC ACCACTGGCA AAGCGATGGG TGACTACGGT 
TGTATGCTGC GCGCCTATCG CCGTCATATT GTCGATGCGA TGTTGCACTG CCATGAACGC 
AGCACCTTTA TCCCGATTCT GGCGAATATC TTCGCCCGCC GTGCAATTGA AATTCCAGTA 
CATCATGCCG AGCGTGAGTT TGGTGAATCC AAATACAGTT TTATGCGCCT GATTAATTTG 
ATGTACGACC TGGTGACCTG CCTTACCACA ACGCCGCTAC GTATGCTGAG TCTGCTCGGT 
AGCATTATTG CGATTGGAGG TTTTAGCATT GCGGTGCTGC TGGTGATTTT ACGCCTGACC 
TTCGGACCAC AATGGGCGGC AGAAGGCGTC TTTATGCTAT TTGCCGTGCT GTTTACTTTT 
ATTGGCGCTC AGTTTATCGG CATGGGATTA CTCGGTGAAT ATATCGGCAG GATCTACACC 
GATGTCCGCG CCCGCCCCCG CTATTTTGTT CAGCAAGTTA TCCGTCCATC CAGCAAGGAA 
AATGAATAA

Protein sequence

MFEIHPVKKV SVVIPVYNEQ ESLPELIRRT TTACESLGKE YEILLIDDGS SDNSAHMLVE 
ASQAENSHIV SILLNRNYGQ HSAIMAGFSH VTGDLIITLD ADLQNPPEEI PRLVAKADEG 
YDVVGTVRQN RQDSWFRKTA SKMINRLIQR TTGKAMGDYG CMLRAYRRHI VDAMLHCHER 
STFIPILANI FARRAIEIPV HHAEREFGES KYSFMRLINL MYDLVTCLTT TPLRMLSLLG 
SIIAIGGFSI AVLLVILRLT FGPQWAAEGV FMLFAVLFTF IGAQFIGMGL LGEYIGRIYT 
DVRARPRYFV QQVIRPSSKE NE