Gene Saro_0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0038
Symbol
ID	3916041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	39737
End bp	40942
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	68%
IMG OID	640442763
Product	hypothetical protein
Protein accession	YP_495321
Protein GI	87198064
COG category	[S] Function unknown
COG ID	[COG2733] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATAG TCGCGACCTT CCTGCTCGTG CTGATGGCCG TGCTCTATGC GTTCAGCCGG 
CGGTACGAAG GGCTGCACCC GGCGGTCGGT TTCCTGCGCG CCTTTGCCGA GGCGGCGATG 
GTCGGCGGGC TGGCGGACTG GTTTGCGGTG ACTGCCCTGT TCCGCCATCC GCTCGGCCTG 
CCCATCCCGC ACACCGCGAT CATCCCGGAG AACAAGGATC GCATTGCCGA TACGATGGCG 
GCGTTCCTGC AGACCAACTT CCTGACCCCG CAGGTGGTGG CGCGGCGCAT GGGCGCGGTG 
AACTCGGCTG CCGCGATGGG CGCATTTCTG GCCGACCCGC GCGCCGGCGA AAGCCGCCTG 
CGCGACGGCG CCGCCGGACT GGTGGCGGAC GTGCTGGAAT CGCTCGATCC CGAGGAGCTT 
GGCGGGCTGG CCAAGGGCGC GCTGAAGGCG CAGCTCGAAA GGCTGGAGCT TTCGCCGCTG 
CTGGGCCAGT TGCTGGGCGC GGCGATTGCC GACGGGCGGC ACATGCCCGT GATCGAGAGC 
CTGATCCGCA AGGCCGCGGA GACGATCGAG GCCAACGAGC CGCTGATACA GGCGACGATC 
CACGAGCGTG CCAACACGAT CCTGCGCTGG ACCGGCCTCG ACGAGAAGCT CGCCAACGCA 
ATCCTCGACG GCCTCTACAA GCTTCTGGCC GAGACACTGG TGGTGCCCGA CCATCCCGTG 
CGTCGGAAGA TCGAGGACGG CCTTGCCGCA TTGGCGCACG ATCTGGTCCA CGATGCCGAG 
ATGCGCGCGC GGGTCGAACG GATGAAGACC GAAGTCCTCG CCAATCCTGC CTTTGCCCGT 
TGGCTCGACG CGCTGTGGGA GCGCGGTCGA ACCCGGCTCC TGCAGATCGT CCGCAATCCC 
GAGGGCGCGC TTGGCGGACA GCTCGGGGCC AGCCTTGCCG AGCTGGGCCT TGCCCTTCAG 
CGTGACGAAC GGCTGCAGCG GGTGGTCAAC CGCTTTGCCC GCAGGACGCT GGTCGGCGTC 
TCGACCCGCT ATGGCGCGCA GATCGTGCGG CTGGTGTCGG AAACGGTGAA GCGCTGGGAT 
GCGCGGACCG TGACCGACCG CATCGAAGGC GCGGTGGGCC GCGACCTACA GTTCATCCGC 
ATCAACGGCA CGTTGGTCGG CGGGCTGGTC GGACTGCTGC TCCATGCCGT GGACCTTGCC 
CTGTGA

Protein sequence

MRIVATFLLV LMAVLYAFSR RYEGLHPAVG FLRAFAEAAM VGGLADWFAV TALFRHPLGL 
PIPHTAIIPE NKDRIADTMA AFLQTNFLTP QVVARRMGAV NSAAAMGAFL ADPRAGESRL 
RDGAAGLVAD VLESLDPEEL GGLAKGALKA QLERLELSPL LGQLLGAAIA DGRHMPVIES 
LIRKAAETIE ANEPLIQATI HERANTILRW TGLDEKLANA ILDGLYKLLA ETLVVPDHPV 
RRKIEDGLAA LAHDLVHDAE MRARVERMKT EVLANPAFAR WLDALWERGR TRLLQIVRNP 
EGALGGQLGA SLAELGLALQ RDERLQRVVN RFARRTLVGV STRYGAQIVR LVSETVKRWD 
ARTVTDRIEG AVGRDLQFIR INGTLVGGLV GLLLHAVDLA L