Gene Saro_3314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3314
Symbol
ID	3915961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3536777
End bp	3538483
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	69%
IMG OID	640446099
Product	heat shock protein Hsp70
Protein accession	YP_498583
Protein GI	87201326
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCATCG GGATCGACCT GGGAACCACC AACAGCGCGG TGGCCTTGTG GCATGAGGGC 
GAGGCACGGC TCGTGCCCAA TTCACTGGGA GCGCTGCTGA CCCCGTCGGC GGTTTCGGTG 
CTGCAGGACG GGACGACGCT TGTCGGCGCG GCGGCATTCG AACGCATGGC CGCGAAGGAT 
GGCGCGGCGG CTACCAGCTT CAAGCGCCTG CTGGGCACCG ACCGCAAGGT GCGCCTTGGC 
CGCAAGGAGT TCTCGGCGGA AGATCTCTCG GCGCTGGTCC TGCAGTCACT GTGCGCCGAC 
GTCGAGGCGC ATACCGGCGA GCGGCCGACC GAGGCGGTGA TCACGGTCCC CGCCTATTTC 
AACGACCGCC AGCGCAAGGC GACGCGCCGC GCAGGCGAAC TGGCGGGCCT CTCCGTGCGG 
CGCCTGATCA ACGAACCAAC CGCAGCCGCG CTGGCATTCG GCCTGAAGGA CAAGGCGGAG 
CGTGAACCCT TTCTGGTCTT CGATCTCGGT GGCGGGACGT TCGATGTCTC CATCGTCGAG 
ATGTTCGAAG GCATCGTCGA GGTCCGCGCC TCGGCGGGCG ACAACCGGCT TGGCGGCGAT 
GATTTCAACG GTGCGCTGGC GATGGCGGTC AAGGGGCGGC TCGATCCCGA CGAAAGACTT 
GCGACCCTGG GCGAGGCCCG CGCGCAGGCG CTGCTGCTGC AGGCGGCCGA ACGGACCAGG 
CGTGCCCTGA CCGATGCACC GGAGGCCGAG TTCGCCGTGA CCGCCGGCGA CGAACGGCTT 
TCGACCACCG TCACCGCCAG CGAGTTCGAG GCGCAGGCCG AGGGCCTGCT GCGCCGGTTG 
CGCGACCCGG TCGTGCGGGC CCTGCGCGAC AGCCAGATCG ATGCGGCGTC CCTCAGCGAG 
ATCGTGCTTG TCGGCGGGGC GACGCGCATG CCGCTGGTGC GCAAAGCGAT AACCCGGTTA 
TTCGGCCGCT TCCCCAATGC GTCCGTCCAC CCGGACCACG CGGTCGCCCT TGGCGCCGCG 
ATCCAGGGCG GGCTGATCGC GCGCGATGGC GGGCTGGAGG AAATCCGGAT CACCGATGTC 
TGCCCCTTCA CGCTCGGCAT CGAGACGGCG GAACACTCTG TGCGGGGCAC GATCCAGCAG 
GGCCTGTTCT CGCCGATCAT CGAGCGCAAT ACCCCGGTGC CGGTCAGCCG CTCGGGCGTC 
TACAGCACCA TGGGCGACGG GCAGAAGCAG ATCGCGGTGC ACATCTACCA GGGCGAGGCG 
CGCGAGGTTT CGGGCAATGT CAAACTCGGG ACGCTGTCCG TCCCGGTGCC GTCCCGGCCC 
GCTGGCGAGG TGTCGATAGA CGTGCGCTTT TCCTATGATA GCTCCGGCCT GCTCGAAGTG 
GACGTTGAGG TGCCGCTGAC CGGGACGAGG CACAACCTCG TCATCATCGA CGAGGAAGAC 
CGCAAGGCCG CGAAGGATCT CGATGCCCGT CGCAAGGCGC TGGCCGCGCT CAAGCACCAC 
CCGCGAGAGG AGGCCGCGAA CCAGCTCCTG CTCGCGCGGG CCGAACGCTG CTACGAGGAA 
TTCCTCGGCG ACGTGCGCGC GGTGATCGGC GGGCGCACGC TTTCGTTCAC CACCGCGCTC 
GACAGCCAGG ACCCGCGCCG CATCGCCGAC GCCGCGGCCG AGCTTGCCGA ACTGCTTGAC 
ATGCTGGAAG CGAACCCGGT CCTGTGA

Protein sequence

MLIGIDLGTT NSAVALWHEG EARLVPNSLG ALLTPSAVSV LQDGTTLVGA AAFERMAAKD 
GAAATSFKRL LGTDRKVRLG RKEFSAEDLS ALVLQSLCAD VEAHTGERPT EAVITVPAYF 
NDRQRKATRR AGELAGLSVR RLINEPTAAA LAFGLKDKAE REPFLVFDLG GGTFDVSIVE 
MFEGIVEVRA SAGDNRLGGD DFNGALAMAV KGRLDPDERL ATLGEARAQA LLLQAAERTR 
RALTDAPEAE FAVTAGDERL STTVTASEFE AQAEGLLRRL RDPVVRALRD SQIDAASLSE 
IVLVGGATRM PLVRKAITRL FGRFPNASVH PDHAVALGAA IQGGLIARDG GLEEIRITDV 
CPFTLGIETA EHSVRGTIQQ GLFSPIIERN TPVPVSRSGV YSTMGDGQKQ IAVHIYQGEA 
REVSGNVKLG TLSVPVPSRP AGEVSIDVRF SYDSSGLLEV DVEVPLTGTR HNLVIIDEED 
RKAAKDLDAR RKALAALKHH PREEAANQLL LARAERCYEE FLGDVRAVIG GRTLSFTTAL 
DSQDPRRIAD AAAELAELLD MLEANPVL