Gene ECH74115_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1091
Symbol	asnC
ID	6968823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1120412
End bp	1121812
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	53%
IMG OID	643385103
Product	asparaginyl-tRNA synthetase
Protein accession	YP_002269602
Protein GI	209397026
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0017] Aspartyl/asparaginyl-tRNA synthetases
TIGRFAM ID	[TIGR00457] asparaginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000126096
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.367452
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTG TGCCTGTAGC CGACGTACTC CAGGGCCGCG TAGCCGTTGA CAGCGAAGTC 
ACCGTACGCG GATGGGTACG TACCCGCCGA GATTCAAAAG CTGGCATCTC CTTCCTCGCC 
GTTTATGACG GTTCCTGCTT TGATCCTGTA CAGGCTGTCA TCAATAATTC TCTGCCCAAT 
TACAATGAAG ACGTCCTGCG TCTGACCACC GGCTGCTCGG TCATTGTGAC GGGTAAAGTC 
GTGGCGTCGC CGGGCCAGGG GCAACAATTT GAAATTCAGA CCAGCAAGGT TGAAGTTGCT 
GGTTGGGTTG AAGATCCAGA CACTTACCCG ATGGCGGCAA AACGCCACAG CATTGAGTAT 
CTGCGTGAAG TCGCTCACCT GCGTCCGCGC ACAAACCTGA TTGGTGCCGT CGCGCGCGTT 
CGCCATACGC TGGCGCAGGC GCTGCATCGC TTCTTTAACG AGCAGGGATT CTTCTGGGTT 
TCAACGCCAC TGATTACTGC GTCTGATACC GAAGGGGCTG GCGAAATGTT CCGCGTTTCT 
ACGCTGGATC TGGAAAATCT GCCGCGTAAC GATCAGGGCA AAGTGGATTT CGACAAAGAC 
TTCTTTGGTA AAGAGTCTTT CCTGACCGTA TCTGGCCAGT TGAACGGCGA AACCTACGCT 
TGCGCATTAT CCAAAATTTA TACCTTCGGC CCGACTTTCC GTGCTGAAAA CTCCAACACC 
AGCCGTCACC TGGCGGAATT CTGGATGCTG GAGCCGGAAG TGGCGTTTGC TAACCTGAAC 
GATATCGCGG GTCTGGCTGA AGCCATGCTG AAATATGTCT TCAAAGCGGT TCTCGAAGAA 
CGCGCTGACG ACATGAAATT CTTCGCTGAA CGCGTAGATA AAGATGCCGT TTCACGTCTG 
GAACGCTTTA TTGAGGCCGA TTTCGCGCAG GTGGATTACA CCGAAGCAGT AACCATTCTC 
GAAAACTGCG GCAGGAAGTT TGAAAACCCG GTTTACTGGG GCGTCGATCT CTCTTCTGAG 
CATGAGCGTT ATCTGGCGGA AGAACACTTT AAAGCACCGG TAGTGGTTAA AAACTATCCG 
AAAGATATTA AAGCGTTCTA TATGCGCCTC AACGAAGACG GTAAAACCGT TGCGGCTATG 
GATGTTCTGG CTCCGGGCAT CGGTGAGATC ATTGGTGGCT CCCAGCGTGA AGAGCGTCTG 
GACGTGCTGG ACGAGCGTAT GCTGGAAATG GGCCTGAACA AAGAAGATTA CTGGTGGTAT 
CGCGATCTGC GTCGCTACGG TACTGTTCCG CATTCCGGTT TCGGTCTTGG TTTTGAACGC 
CTGATTGCTT ACGTAACTGG TGTGCAAAAC GTGCGTGATG TGATTCCGTT CCCACGAACT 
CCGCGTAACG CCAGCTTCTA A

Protein sequence

MSVVPVADVL QGRVAVDSEV TVRGWVRTRR DSKAGISFLA VYDGSCFDPV QAVINNSLPN 
YNEDVLRLTT GCSVIVTGKV VASPGQGQQF EIQTSKVEVA GWVEDPDTYP MAAKRHSIEY 
LREVAHLRPR TNLIGAVARV RHTLAQALHR FFNEQGFFWV STPLITASDT EGAGEMFRVS 
TLDLENLPRN DQGKVDFDKD FFGKESFLTV SGQLNGETYA CALSKIYTFG PTFRAENSNT 
SRHLAEFWML EPEVAFANLN DIAGLAEAML KYVFKAVLEE RADDMKFFAE RVDKDAVSRL 
ERFIEADFAQ VDYTEAVTIL ENCGRKFENP VYWGVDLSSE HERYLAEEHF KAPVVVKNYP 
KDIKAFYMRL NEDGKTVAAM DVLAPGIGEI IGGSQREERL DVLDERMLEM GLNKEDYWWY 
RDLRRYGTVP HSGFGLGFER LIAYVTGVQN VRDVIPFPRT PRNASF