Gene EcHS_A0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0059
Symbol	surA
ID	5595320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	56678
End bp	57964
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	54%
IMG OID	640919247
Product	peptidyl-prolyl cis-trans isomerase SurA
Protein accession	YP_001456842
Protein GI	157159524
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0760] Parvulin-like peptidyl-prolyl isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0000468252
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAACT GGAAAACGCT GCTTCTCGGT ATCGCCATGA TCGCGAATAC CAGTTTCGCT 
GCCCCCCAGG TAGTCGATAA AGTCGCAGCC GTCGTCAATA ACGGCGTCGT GCTGGAAAGC 
GACGTTGATG GATTAATGCA GTCGGTAAAA CTGAACGCTG CTCAGGCAAG GCAGCAACTT 
CCTGATGACG CGACGCTGCG CCACCAAATC ATGGAACGTT TGATCATGGA TCAAATCATC 
CTGCAGATGG GGCAGAAAAT GGGAGTGAAA ATCTCCGATG AGCAGCTGGA TCAGGCGATT 
GCTAACATCG CGAAACAGAA CAACATGACG CTGGATCAGA TGCGCAGCCG TCTGGCTTAC 
GATGGTCTGA ACTACAACAC TTATCGTAAC CAGATCCGCA AAGAGATGAT TATCTCTGAA 
GTGCGTAACA ACGAGGTGCG TCGTCGCATC ACCATCCTGC CGCAGGAAGT CGAATCCCTG 
GCGCAGCAGG TGGGTAACCA AAACGACGCC AGCACTGAGC TGAACCTGAG CCACATCCTG 
ATCCCGCTGC CGGAAAACCC GACCTCTGAT CAGGTGAACG AAGCGGAAAG CCAGGCGCGT 
GCCATTGTCG ATCAGGCGCG TAACGGCGCT GATTTCGGTA AGTTGGCGAT TGCTCATTCT 
GCCGACCAGC AGGCGCTGAA CGGCGGCCAG ATGGGCTGGG GCCGTATTCA GGAGTTGCCG 
GGGATCTTCG CCCAGGCATT AAGCACCGCG AAGAAAGGCG ACATTGTTGG CCCGATTCGT 
TCCGGCGTTG GCTTCCATAT TCTGAAAGTT AACGACCTGC GCGGCGAAAG CAAAAATATC 
TCGGTGACCG AAGTTCATGC TCGCCATATT CTGCTGAAAC CGTCGCCGAT CATGACTGAC 
GAACAGGCCC GTGTGAAACT GGAACAGATT GCTGCTGATA TCAAGAGTGG TAAAACGACT 
TTTGCTGCCG CAGCGAAAGA GTTCTCTCAG GATCCAGGCT CTGCTAACCA GGGCGGTGAT 
CTCGGCTGGG CTACACCAGA TGTTTTCGAT CCGGCCTTCC GTGACGCCCT GACTCGCCTG 
AACAAAGGTC AAATGAGTGC ACCGGTTCAC TCTTCATTCG GCTGGCATTT AATCGAACTG 
CTGGATACCC GTAATGTCGA TAAAACCGAC GCTGCGCAGA AAGATCGTGC ATACCGCATG 
CTGATGAACC GTAAGTTCTC GGAAGAAGCA GCAAGCTGGA TGCAGGAACA ACGTGCCAGC 
GCCTACGTTA AAATCCTGAG CAACTAA

Protein sequence

MKNWKTLLLG IAMIANTSFA APQVVDKVAA VVNNGVVLES DVDGLMQSVK LNAAQARQQL 
PDDATLRHQI MERLIMDQII LQMGQKMGVK ISDEQLDQAI ANIAKQNNMT LDQMRSRLAY 
DGLNYNTYRN QIRKEMIISE VRNNEVRRRI TILPQEVESL AQQVGNQNDA STELNLSHIL 
IPLPENPTSD QVNEAESQAR AIVDQARNGA DFGKLAIAHS ADQQALNGGQ MGWGRIQELP 
GIFAQALSTA KKGDIVGPIR SGVGFHILKV NDLRGESKNI SVTEVHARHI LLKPSPIMTD 
EQARVKLEQI AADIKSGKTT FAAAAKEFSQ DPGSANQGGD LGWATPDVFD PAFRDALTRL 
NKGQMSAPVH SSFGWHLIEL LDTRNVDKTD AAQKDRAYRM LMNRKFSEEA ASWMQEQRAS 
AYVKILSN