Gene Saro_2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2356
Symbol
ID	3915701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2502950
End bp	2504809
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	67%
IMG OID	640445111
Product	hypothetical protein
Protein accession	YP_497626
Protein GI	87200369
COG category	[S] Function unknown
COG ID	[COG4805] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.805345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCACTGA CGCGTCGCGT TTCGACCTGC GCGATCGCAC TGGCGATCAT CCTTGCCGGG 
TGCGCACCGG CGACGGCCCG GACAGGCGCT TCGGCCGACA CGATACCGAC TGCCCGGATC 
GACGCGGCAC CGCCTCCCCT GCCCGTCACT TCGGCCAACG TGGCGCTGGA CCGCCTGTTC 
GCGGAAGATG CGCAAGTCTC GATGCAACTC GACCCGCTCG GCTCGCTGGA GCAGGGACAC 
AAGGTCCCGG TCGAGCGGTT CGTGCTGCTG TTCACCCCGG AACTCATCCG CGAACGGCGC 
GAGGCGAATG CCCGGTCCCT GGCCGAGCTG GCCAGGATCG ATCCGGCAAA GCTCGATCGC 
AACCGCCGCA TCTCGCGCGC AGTATTCGAG GATGCAAAGC GGAACGAACA GGCGCTTCTC 
GCACCCGACG TCCAGCCACT TTTCGCGGCG CAGCCCTTCA ACCACTTCGG CGGCTTCCAT 
GTCGCCTATC CGGAGCTTTC CGCACCGGGC AGCGGCATCG CACTCGACAC GGTCGAGGAT 
TATCGGCTGC TCATTGCGCG GCACAAGGCA CTGCCGCAGG TCTTCGGCCA GGCCATCGCC 
CGGTTCCGGG AAGGCATGGC CAGCGGGGTT ACCGAGCCTC GGCTGACAGT CGACAACATG 
ATCGTGCAGA TCGACGCGCT GCTGGCCCAG CCGGTAGACC GTTCGCCATT CCTGGCTCCT 
GCGCGGCAGT TTCCGGACGA TGTGCCGGCA GCCGAACGCG CCAGGCTGGC GCGGGAGCTG 
GCGACGGTGG CGCGGCGCGA GATCTATCCG GCCTATCGGA CGCTGCGCCG CTTCCTAGCC 
AACGAATACC GGCCCGTGGC GCGCGAGCAG GTCGGCCTTT CGGCGCTTCC AGACGGCGAA 
CGGCTATACC GACTGCTGGC GCGGCAGCAT ACCACTGTGG ACCTCGACCC GGCGGCGGTG 
CACGAACTGG GTCTATCTGA GGTGGCACGC ATCCAGTCCG AAATGGAGGA CGTGAAGCGC 
CAGCTCGGTT TCCAGGGCCC GCTGCGCAGC TTCTTCGACC ACATCCGGAC CGACCCGAAG 
TACCACCCGC ACACGGAGCG GGAACTGGCG GAGGGGTTCC GCGCCGTGGG CCGCAAGGTC 
GACGCGCTGG CGCCGCAGTA CTTCCTGCAC CTGCCCCTCA CACCGCTGCT GATACAGCCC 
TACCCCGCCT ACCGCGCACG GTTCGAGGCA GGCGGCAGCT ATGCGCAGGG ATCGGCTGAC 
GGGAAGCAAC CCGGCGTATT CTTCTACAAT ACCTATGACC TGAAGAGCCG CTTCCTGACC 
GGCGTTACCA CGCTCTATCT CCATGAAGGC GCGCCGGGGC ATCACTTCCA GATCAGCCTG 
GCGCAGGAAA ACGCGAACCT CCCGGACTTC CAGCGCTTTG GCGGCAACAC GGCCTATATC 
GAAGGCTGGG CGCTCTATGC GGAGACGCTG GGCTACGAGA TGGGGTTCTA CAAGGACCCG 
ATGCAGCACT GGGGCACGCT CGACGACGAA ATGCTGCGCG CGATGCGGCT CGTCGTGGAC 
ACCGGCCTTC ACACCAGGGG ATGGAGCCGA GAAGAAGCGG TCGATTACAT GCTGGCCAAT 
TCCGGCATGG GCCGCACCGA TGCGCAGGCC GAAGTCGACC GCTACATCGC CAACCCGGGT 
CAGGCGCTGG CCTACAAGAT CGGAGCGCTG ACGATCCAGC GCCTGCGCCG GGAAGCGGAG 
GCGGCACTGG GCCGGCGCTT CGACATCCGC CAGTTCCACG ACCAGATTCT GGGGAGCGGC 
GCGCTGCCGA TGCCGGTTCT CGAGGCCAAG GTGCGGGGTT GGATCGCCGC CACGCGTTGA

Protein sequence

MALTRRVSTC AIALAIILAG CAPATARTGA SADTIPTARI DAAPPPLPVT SANVALDRLF 
AEDAQVSMQL DPLGSLEQGH KVPVERFVLL FTPELIRERR EANARSLAEL ARIDPAKLDR 
NRRISRAVFE DAKRNEQALL APDVQPLFAA QPFNHFGGFH VAYPELSAPG SGIALDTVED 
YRLLIARHKA LPQVFGQAIA RFREGMASGV TEPRLTVDNM IVQIDALLAQ PVDRSPFLAP 
ARQFPDDVPA AERARLAREL ATVARREIYP AYRTLRRFLA NEYRPVAREQ VGLSALPDGE 
RLYRLLARQH TTVDLDPAAV HELGLSEVAR IQSEMEDVKR QLGFQGPLRS FFDHIRTDPK 
YHPHTERELA EGFRAVGRKV DALAPQYFLH LPLTPLLIQP YPAYRARFEA GGSYAQGSAD 
GKQPGVFFYN TYDLKSRFLT GVTTLYLHEG APGHHFQISL AQENANLPDF QRFGGNTAYI 
EGWALYAETL GYEMGFYKDP MQHWGTLDDE MLRAMRLVVD TGLHTRGWSR EEAVDYMLAN 
SGMGRTDAQA EVDRYIANPG QALAYKIGAL TIQRLRREAE AALGRRFDIR QFHDQILGSG 
ALPMPVLEAK VRGWIAATR