Gene Saro_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2044
Symbol
ID	3917691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2181960
End bp	2183027
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	62%
IMG OID	640444796
Product	hypothetical protein
Protein accession	YP_497317
Protein GI	87200060
COG category	[S] Function unknown
COG ID	[COG2899] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTCCGCT TCTACAAGGG TTCGATCCTC TTCACGCTCG TATGCCTTGC ACTGGCGGTG 
GCCTATGGCT GGATGCAGAC CGGGACCGCG TCGGGCACGA TGTCGCTGGT ATGGATCGTG 
TTCGTGCTGT CGATCCTCGA AATCTCGCTG TCGTTCGACA ACGCCGTGGT CAACGCCGCC 
GTGCTGGAGG ACATGGACGA AGTCTGGCAG AAGCGCTTCC TCACCTGGGG CATGGTGATC 
GCCGTGTTCG GGATGCGGAT CGTCTTCCCG TTGGCGATCG TGGCGATTGC CGCAGGGTTA 
GGCCCGATCG AGGCACTGAA CCTCTCGCTG AAGGACCCGA AGCGCTACGA GGAGATCGTC 
AGCAGCGCCC ACGTCGGCAT TGCCGGCTTC GGCGGAGCCT TCCTGGCGAT GGTCGGGCTT 
TCGTTCTTCT TCGACGGAGA GAAGGAAGTC CACTGGATCA AGTGGGTGGA GGAAAAGCTC 
GCCGTCGTCT CGAACATAAA GGCCGCAGAG ATCGCGCTGC TGCTCCTGTC GATCTATGGC 
ATCTCGCTGA TCCTTCCGCC GGAGGAAGCG CTGACGTTCG TCGTCGCGGG CGTTCTCGGC 
CTCGTCACGT TCATCGCGGT CGAAGCGCTC GGCACGATCC TTGAAATGCG CGAGGAAGCG 
CAGAAGGCGG CGGGCGTGGT GGTTCGCTCG GGCCTGGGCG GTTTCCTCTA CCTCAACGTG 
CTCGACGCCT CGTTCAGCTT CGACGGCGTG ATCGGCGCCT TCGCGCTTTC CAACAACATG 
GTGATCATCG CTCTCGGCCT TTCGATCGGT GCGATGTTCG TCCGCTCGAT GACGATCATG 
CTGGTCCAGA AGGGCACGCT CTCGGAGTAT CGCTACCTCG AACACGGCGC ATTCTGGGCG 
ATCATCGCGC TCGGTGCGAT CATGCTGCTG TCGGCGCGCT ACCACATCCC CGAAACGGTC 
ACGGGTCTGA TCGGTGCGGC GCTGATCGGC CTATCGCTGT GGTGGTCGAT CCGCCACAAG 
CGCAAGTACC CCGATGCCGA ACTGGACGCC GCCGTAAGGG CCGACTGA

Protein sequence

MLRFYKGSIL FTLVCLALAV AYGWMQTGTA SGTMSLVWIV FVLSILEISL SFDNAVVNAA 
VLEDMDEVWQ KRFLTWGMVI AVFGMRIVFP LAIVAIAAGL GPIEALNLSL KDPKRYEEIV 
SSAHVGIAGF GGAFLAMVGL SFFFDGEKEV HWIKWVEEKL AVVSNIKAAE IALLLLSIYG 
ISLILPPEEA LTFVVAGVLG LVTFIAVEAL GTILEMREEA QKAAGVVVRS GLGGFLYLNV 
LDASFSFDGV IGAFALSNNM VIIALGLSIG AMFVRSMTIM LVQKGTLSEY RYLEHGAFWA 
IIALGAIMLL SARYHIPETV TGLIGAALIG LSLWWSIRHK RKYPDAELDA AVRAD