Gene Saro_1822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1822
Symbol
ID	3918381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1922605
End bp	1923888
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	69%
IMG OID	640444563
Product	hypothetical protein
Protein accession	YP_497096
Protein GI	87199839
COG category	[S] Function unknown
COG ID	[COG3182] Uncharacterized iron-regulated membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.302713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACGA GCGCGCCCCG CTCGTTCTTT CTGCCCCGGC CGCTCGCGCT GCCGGGGCGG 
GGTTTCTGGG TGATCGCCCA CCGCTGGGCG GGCCTTACCC TTGCGCTGTT CCTTGGCGTG 
GCCGGGCTCA CCGGCTCGCT CCTGCCGTGG ATCGAGGAGC TGGAAGCGGC CACCGCGCCG 
CAGCTCCACA ATTCGGTCTG GACCGGCACG CCCGATCCCC TGCGCGTGCG CGAGGAAGTG 
CTGGCCCGCC ACCCCGGCGC GGCCGTCGAT TTCCTCCCCC TCACCGTGGA GCCAGGCAAG 
TCCCTGCGCC TCCACCTCCA CTGGCTCGAC CCGAAAACCG GGCTGGAGCG CGAACGCGGC 
CCCGGGGTGC CCGACTGGAA CGACCTGTTC CTGAATCCCG TCTCAGGTGA AGAGCAGGGC 
CGCCGCGAAT GGGGCAATAT CGGGCAAGGC CTCAAGAACC TCATGCCCTT CCTCTACCGC 
CTGCACTATA GCCTCGCGCT TGGCGCGATC GGCACGCTGG TCTTCGGGGT GGCGGCGCTG 
ATCTGGACCG TGGACTGCTT CGTCGGATTC TACCTGACCC TGCCCCCGCG CGCGCCAAGG 
TCCGCCCGAG CCCCTTTCCT CGAACGCTGG CGCCCCAGCT GGCGCGTGCG GTGGAAGTCC 
ACGCCCTACA AGCTCAACTT CGACCTCCAC CGCGCCGGGG GCCTGTGGCT CTGGCCGCTG 
CTGCTGGTCT TTGCGTGGTC GAGCGTCTCG TTCAACCTGC CCCAGGTCCA CGTACCGATA 
ATGCAGGCGG TGGGCGCGCA GGACGCGCGT CTCGTGCTGC TGGAAAGCAC GCTACCCGCC 
CCCCGCAACG CCCCGCGGCT GGGCTTCCGG GAAGCCGTTG AACGGGGGCA GGAGCTTGCC 
GAACAGGAGG CGACGAAGCA GGGTCTTGCC GTCCTCGATG AAGGCGAGAG CTGGATCTGG 
CACGTGCCCA CCAGCGGCCT CTACGCCTAC GGCTTCACCA CCGGGGCCGA CATCAGCCAC 
CACGGCGGCG GCACCCGCGT CGCCTTCGAC AGCAACACCG GCGTACTGAA GTCAGTGGAC 
TGGCCGAGCG GCGTCAACGG CGCCAACACC TTCACCAACT GGCTGACTGC GCTGCACACC 
GCCCATGTCT TCGGCCTGCC CTACCGCCTG TTCGTCAGCG CGCTCGGCCT GATGGTCACC 
ATGCTTTCGA TCACCGGCGT GGTGATCTGG CTGAAGAAGC GCTCCGCCCG CGCCGGCCGC 
GCAATCCGCC AGCCCAAAAC ATGA

Protein sequence

MATSAPRSFF LPRPLALPGR GFWVIAHRWA GLTLALFLGV AGLTGSLLPW IEELEAATAP 
QLHNSVWTGT PDPLRVREEV LARHPGAAVD FLPLTVEPGK SLRLHLHWLD PKTGLERERG 
PGVPDWNDLF LNPVSGEEQG RREWGNIGQG LKNLMPFLYR LHYSLALGAI GTLVFGVAAL 
IWTVDCFVGF YLTLPPRAPR SARAPFLERW RPSWRVRWKS TPYKLNFDLH RAGGLWLWPL 
LLVFAWSSVS FNLPQVHVPI MQAVGAQDAR LVLLESTLPA PRNAPRLGFR EAVERGQELA 
EQEATKQGLA VLDEGESWIW HVPTSGLYAY GFTTGADISH HGGGTRVAFD SNTGVLKSVD 
WPSGVNGANT FTNWLTALHT AHVFGLPYRL FVSALGLMVT MLSITGVVIW LKKRSARAGR 
AIRQPKT