Gene Saro_3067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3067
Symbol
ID	3916681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3286112
End bp	3287326
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	69%
IMG OID	640445849
Product	hypothetical protein
Protein accession	YP_498336
Protein GI	87201079
COG category	[S] Function unknown
COG ID	[COG2311] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCGGAAA ACCTGAAACA GACGCGCATT GAGGCGATCG ATTTCCTGCG CGGCGTGGCC 
GTGCTGGGCA TTCTCGCGAT CAACGTGACC GGCTTCTGGG GCCCGTCGCT GGCCACCTTC 
TCGCCCGCGA TCCCGCGGAT GGAACCGGGC GGCGCGGTGT GGTTCGGCTT CGCGTTCGTC 
GTTTTCGAAG GCAAGATGCG CGCGCTGTTC AGCATGCTGT TCGGGGCCAG CATGGTCCTG 
TTCGCGCGCG CGGCGCAGCG TCGCGGACTG GACCCGGGCA AGGCGCAGGT GCGCCGCCTC 
GTGTGGCTCG CAATCTTCGG CTATGCCCAT TACGCCCTGC TGTGGTGGGG AGATATCCTC 
TTCCCCTATG CCCTGTGCGG ACTGTGCGCG CTGCTGCTCA TGCGCCTTTC GCCAGCGGGG 
CTCGTCGCGG TCGCCCTGCC GATCTACCTC CTCTCGCACG GGATCGATGC CCTGCTGGCA 
CTGCCGGGGA TGGCCACGGA ACAGGCGGTC CTGTCCGGCA TCGCCGCTCC GGCGGACGTT 
GCCGAGCAGG CCGGCATGAT GGCGCGGATC GCCGCCTCCA TCTCGAGCGA CCTTGCCGTG 
CTCGACGCGG GGTTTGTCGA CGCCGTCCGC CTGAGGCTTG CAAATGGTGC CGCCGAGCCG 
CTGCGCGTCA CGCTGGCGAC GTTTACCGAA ACCCTGCCAC TGATGCTGAT CGGCATGGCG 
CTGTTGCGAA GCGGCTTCTT CACGACCTGG CCAAAACGCA GCCTGGGCTG GATCGCCGCC 
ATCGGCATCC TGGGGGGAGC GGCGGCGTCC GTCGCCGCGC TATCGTGGCT GGCCGCGCAT 
GGCTGGCCTC CGCGCGCGAT GTTCGGGGCG ATAGAGAGCG GTATGGCGTT CCCCCACCTT 
GCCATGGCGA TCGGATACGC CGCCGGGCTC CTGCTGCTGT TTCCGCACCT TCGCGGCAGG 
GCCGTGGGTC GCGCGCTGGT CGCTGCGGGA CGCTGCGCGT TCAGCAACTA CATCGGCACG 
ACCGTGCTGA TGGGCGCGAT CCTGTCCGGC TGGGGCCTCG GGCTCGGGCC GGAACTCCCG 
AGAGCCTGGC TGCCCGCCCT CGTGCTGCTT GGCTGGTTTG CCATGCTCGC CTGGCCGCGA 
TGGTGGCTAG CCCGCTTCGG GCAGGGGCCG CTTGAGGCGC TCTGGCGCAA GCTTGCCCTT 
CCCGCGCACG CGTAG

Protein sequence

MAENLKQTRI EAIDFLRGVA VLGILAINVT GFWGPSLATF SPAIPRMEPG GAVWFGFAFV 
VFEGKMRALF SMLFGASMVL FARAAQRRGL DPGKAQVRRL VWLAIFGYAH YALLWWGDIL 
FPYALCGLCA LLLMRLSPAG LVAVALPIYL LSHGIDALLA LPGMATEQAV LSGIAAPADV 
AEQAGMMARI AASISSDLAV LDAGFVDAVR LRLANGAAEP LRVTLATFTE TLPLMLIGMA 
LLRSGFFTTW PKRSLGWIAA IGILGGAAAS VAALSWLAAH GWPPRAMFGA IESGMAFPHL 
AMAIGYAAGL LLLFPHLRGR AVGRALVAAG RCAFSNYIGT TVLMGAILSG WGLGLGPELP 
RAWLPALVLL GWFAMLAWPR WWLARFGQGP LEALWRKLAL PAHA