Gene Saro_2969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2969
Symbol
ID	3917404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3188360
End bp	3189616
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	66%
IMG OID	640445747
Product	hypothetical protein
Protein accession	YP_498238
Protein GI	87200981
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0451316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACCA GGATCCTCGG CGCCGCCGCG ATGGCAGCGC CGCTCGCTCT CGCCCAACCT 
GCGGAAGCTG CGCCCGCGTC TTTCGGCGAG GCTGTCGAAG TCGCCGATGG CACCGTGCTG 
GACCCGATAG TCGAGGCACG CCTGCGCTAT GAAGGCGTGG ACCAGCCGAC CACCGACGCC 
GACGCCCTGA CCGTGCGGCT GCGCGCGGGG TTCGAGGTGC GTCATGCGCC CTCGCACCTC 
TCGTTCCTGG CCGAGGCGGA AGGGACGCTC GGCCTGTGGA ACGACTACAA CGCCTTTCCC 
TTCGCGCTTG CCGGCAGTAG CCAAAGGCGA CCGCAGTTCG CCACGGTTCC CGATGCGGAA 
AGCATCGATC TCAATCGCTT GCAGGTGCAG TACCGGACGA AGGGCCTCGC GGTCACGGTC 
GGGCGTCAGC GCATCAATCT CGACGACCAG CGCTTTGTCG GTTCGGTCGG ATGGCGGCAG 
AACGAGCAGA CATTCGATGC GGTGCGGGCC GAGGTCGCGG CAGGGCCGGT CACGTTCGAT 
GGCACTTACG CGATCCGGCA GGATTCGATC TTCGGATCGG AGGCCGGGCC GCGCCGCGCG 
ATGGACGGGG ACTTCGTGTT CCTCAACGCC GGGGCGAAAA CGGGGGCGGT GACCGCCAAG 
GGCTTTGCCT ATCTCATTGA TTATGAAGAG GCCTTTGCCT TCGCCAATTC CTCGCAGACC 
TATGGCGGGC GGATCGCGGC CGGCTTCCCC CTGTCGGCCA AGGTCAAGCT CAGCCTCGTC 
GGCAGCTATG CCCGGCAGAT GGACATGGGC CGCAACCCGG TCCGCTACCG CGCCGACTAT 
CTGCTTGGCG AGGCGGGGCT TTCGTCGCGC GGGTTCACCC TGACGGGCGG CTACGAACGT 
CTCGGGGCAG ACGGGACGGC GGGCAAGGCC TTCCAGACGC CGCTGGCGAC GCTGCACAAG 
TTCAACGGTT GGGCCGACCT GTTCCTGACG ACGCCCGCCG CCGGGCTCGA AGACCGCTAT 
GTCACGCTGG CGAAGGTCTT CCCGAAAGTG AAGGCGCTGC CGGGGCTCAA TGCCATGGTG 
ACCTGGCACG ACCTGCGCAG TGATATCGGA AACGCCCGCT ATGGCACCGA ATGGGACGCC 
AGTGTCGGGT TCAGGTCCGG CAAGGTCGCA TGGCTGGCCA AATATGCCGA CTACGACGCG 
AAGAGCTTCG GTACGGACCG CCGTATCGTG TGGCTCCAGG CTGAAGTCGC ATTCTGA

Protein sequence

MKTRILGAAA MAAPLALAQP AEAAPASFGE AVEVADGTVL DPIVEARLRY EGVDQPTTDA 
DALTVRLRAG FEVRHAPSHL SFLAEAEGTL GLWNDYNAFP FALAGSSQRR PQFATVPDAE 
SIDLNRLQVQ YRTKGLAVTV GRQRINLDDQ RFVGSVGWRQ NEQTFDAVRA EVAAGPVTFD 
GTYAIRQDSI FGSEAGPRRA MDGDFVFLNA GAKTGAVTAK GFAYLIDYEE AFAFANSSQT 
YGGRIAAGFP LSAKVKLSLV GSYARQMDMG RNPVRYRADY LLGEAGLSSR GFTLTGGYER 
LGADGTAGKA FQTPLATLHK FNGWADLFLT TPAAGLEDRY VTLAKVFPKV KALPGLNAMV 
TWHDLRSDIG NARYGTEWDA SVGFRSGKVA WLAKYADYDA KSFGTDRRIV WLQAEVAF