Gene Saro_3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3167
Symbol
ID	3918209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3381637
End bp	3382617
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	640445951
Product	twin-arginine translocation pathway signal
Protein accession	YP_498436
Protein GI	87201179
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGACG CAAAGCTTGA TCGCCGCTCG CTGATCGCGG CGCTGGCCGC CACCGGAGTT 
GCCGCCATGA CCGGAACCGA CGCCATCGCG CGCGCTGCCG CCCGCAAGCC CTTCTTCCAG 
CGCATCGGCA AGCCTATCGG CTTGCAGCTC TACACCCTGG GCGACAAGCC GACGCAGGAC 
CTCGACGGTA CGCTGGCGCG GCTTGCGGCC ATCGGCTTTA CCGACATCGA GTTGCCCAAT 
TTCTACAATC GCACTCCCGC AGAGCTGCGT GCCGCTGCCG ACAAGGCTGG GGTCCGCTAC 
AGTTCGATCC ACATGAACAT GCCGGGCCCG TTCACCGGCG GCGCACTCAG CCTGATGAGC 
GCTCCCCAGG AAATCGCCGA CGGGCTGAAC ACGCTCGGCA TCCATCAGGT GTTCCTGCCG 
CTTTGCCCCC TGCCCGAAGG CTTTTCGGTG CCCGAAGGAA AGAGCCCGCA GGTGGCGATC 
GGCGACGCCT TGCGGGCAGC CGGCGCGGAC CACTGGAAGC GCACCGCGGC CCTGCTGAAC 
GAACGGGGCG CAGCCTTGCG GCCCTTCGGC ATCCGGCTCG GCTACCACAA CCACAACATG 
GAGTTCGCCC CGCTCGATGG CGGGGCGACC GGGTGGGACA TCCTGATCCG CGAGACCGAT 
CCCGCGCTCG TCAATTTCGA ACTGGACCTG GGCTGGACTT CGGCCGCGGG ACACGATCCC 
GTCGTCGAAC TGGGCAGGCT CAAGGGGCGG GTAAAGGCGG TGCACGTCAA GGACATCAAG 
GCATCGACGA AAACCAACTT CGTCATGGGC CAGGATCCTA CCGAGGTGGG TTCGGGGCGC 
CTGCAATGGG CGAAGATCCT GCCCGCTGCC CTCGCCGCGG GGGTCGAGCA CTTCTATGTC 
GAGCAGGAAC CGCCATTCAC GATGGACCGC CTCGACGCGG TAACGAAAAG CCACGCATTC 
CTGTCGCGCT TCGTGGCCTG A

Protein sequence

MHDAKLDRRS LIAALAATGV AAMTGTDAIA RAAARKPFFQ RIGKPIGLQL YTLGDKPTQD 
LDGTLARLAA IGFTDIELPN FYNRTPAELR AAADKAGVRY SSIHMNMPGP FTGGALSLMS 
APQEIADGLN TLGIHQVFLP LCPLPEGFSV PEGKSPQVAI GDALRAAGAD HWKRTAALLN 
ERGAALRPFG IRLGYHNHNM EFAPLDGGAT GWDILIRETD PALVNFELDL GWTSAAGHDP 
VVELGRLKGR VKAVHVKDIK ASTKTNFVMG QDPTEVGSGR LQWAKILPAA LAAGVEHFYV 
EQEPPFTMDR LDAVTKSHAF LSRFVA