Gene Saro_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0401
Symbol
ID	3918285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	440475
End bp	441857
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	64%
IMG OID	640443130
Product	hypothetical protein
Protein accession	YP_495683
Protein GI	87198426
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1030] Membrane-bound serine protease (ClpP class)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.680727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCA TCGTACGCCA CAGCTGGCTC CGCCTGTTCC TGCTATCGCT TCTGTTGGCA 
GGTTTCGCGC AGGCGTGGGC CAACGCCCAG ACGCAGCCCG GCAGAGATGA GGTGCCCGTT 
CTCACGATCG AAGGGGCCAT CGGCCCCGCG ACGGCAGACT ACGTCGCGGG CGGCATAGCC 
CGGGCGGCCG AGCAGGGCGC GCCGATGGTG ATCATCCGCA TGGATACTCC CGGTGGGCTC 
GACACCTCGA TGCGCGAGAT CATTCGCGCC ATCCTGGGTT CTCCGGTTCC CGTTGTGACA 
TATGTCAGTC CCAGCGGCGC GCGCGCTGCG AGCGCTGGCG CTTTCATACT GACTGCGAGT 
CACGTGGCGG CAATGGCCCC GGGGACCAAT GTCGGGGCGG CGACACCGGT TCAATTGGGA 
GCGCCGGCCG CACCCTCAAC GCCCAAATCC AGCGATCAGC AGGCCGACGA CAAGGGCACC 
TCATCTCCAG CGAAATCTGG CGGTGCCAGC GAGGCCAAGG CCCTCAACGA CGCCATTGCC 
TACATTCGCT CACTCGCGGA AATGCGGGGG CGCAATGCGG ACTGGGCGGA AGCGGCAGTG 
CGCGAAGCGG CGAGCCTCTC GGCCAAGAGC GCCCTTGAGC AAAAGGTCAT CGATATCGTG 
GCCCGAGACG ACGGTGATCT GCTCGCCCAG ATCAATGGTC TCACCGTCGC CTTGGGCAAT 
GGACAAGTCC GGCTCCAGAC AGACGGAGTA CGCTTGACGG AGGTCCTTCC CGATTGGCGT 
ACCCGGCTAC TGTCAGCGAT CACCAATCCG AACATCGCCC TGATCCTGAT GATGATTGGC 
GCCTACGGGC TGCTGTTCGA GTTCATGAAC CCCGGCGCGC TGTACCCCGG TACAATCGGG 
GCCATCAGCC TTTTGCTCGG TTTTTATGCC CTGTCCGTCC TTCCGGTGAA CTATGCCGGG 
CTCGCTCTCA TCGTGCTCGG CCTGGCACTG ATGGGGGCCG AAGCGTTCTC GCCCTCCTTC 
GGCATCCTGG GCATCGGTGG AATGATAGCC TTCGTTCTCG GCGCGACCAT CATGTTCGAT 
ACAGATGTCC CGCAATTCCG TGTCGCGCTC CCGGTGTTGG CGGCGATCGC CGTCGCCAGT 
CTCGGCGCAA CTGTGCTGAC CATGCGACTG GCGCTACGGT CACGCCGGAG CAGCGTTGCG 
ACCGGCCGCG AGGAAATGAT CGGTGCGACC GGCAGCGTGC TGGATTGGCA GGGAACCGGC 
GGACATGTCC GGGTCCATGG CGAGCGCTGG AACGCCCGCG CCGTCAGCGA GCTTCACGCG 
GGACAGGAGG TCCGCATTAT CCGGCTTCAG GGCCTGACAG TGGAGGTTGA ACCCGCAAAT 
TAG

Protein sequence

MDTIVRHSWL RLFLLSLLLA GFAQAWANAQ TQPGRDEVPV LTIEGAIGPA TADYVAGGIA 
RAAEQGAPMV IIRMDTPGGL DTSMREIIRA ILGSPVPVVT YVSPSGARAA SAGAFILTAS 
HVAAMAPGTN VGAATPVQLG APAAPSTPKS SDQQADDKGT SSPAKSGGAS EAKALNDAIA 
YIRSLAEMRG RNADWAEAAV REAASLSAKS ALEQKVIDIV ARDDGDLLAQ INGLTVALGN 
GQVRLQTDGV RLTEVLPDWR TRLLSAITNP NIALILMMIG AYGLLFEFMN PGALYPGTIG 
AISLLLGFYA LSVLPVNYAG LALIVLGLAL MGAEAFSPSF GILGIGGMIA FVLGATIMFD 
TDVPQFRVAL PVLAAIAVAS LGATVLTMRL ALRSRRSSVA TGREEMIGAT GSVLDWQGTG 
GHVRVHGERW NARAVSELHA GQEVRIIRLQ GLTVEVEPAN