Gene Saro_2275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2275
Symbol
ID	3916593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2415703
End bp	2416887
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	67%
IMG OID	640445031
Product	histidine kinase
Protein accession	YP_497546
Protein GI	87200289
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0585084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGGTT TGTCGCTGCC TCTCCCCAGC ATGTTCGTCG CCCTGTGCGC GGCCGTGGTC 
ATGTACTTCG GCGGCGCCGG CTTCTGGCTC TCGCTCGCGA TCCTGCTCGT CTGGCTGGCG 
ACACTGTGGC TCGCCCGACC CGAGCCGACG GTGGAAACCC GCAGCAGGGA TGACGGCAGC 
GTCTCGCGCC AGGCAATGAT CGAACTGGTC GAACCCTTCG GCCTGCCGGT CCTGATGCTG 
GACGGACAGC GCATCGCAGC CGCCAACGCG GCCGCGCGGG AGGAACTCGG CAGCCATATC 
GTCGGCCAGG ACGCGCGCGT GGCGCTGCGC CATCCCGAAG CGGTCCGCCT CCTGGACAAG 
CCCGAGGGCC GGGCGCTGGT GCGGGGTCTC ACGGGCGCGC GCAGCATCTG GCAGGTAAGC 
CGCGTGCCGA TCGACGAACG CTTCTCGCTG ATCGAGTTCG TCAACCGCAC GGCAGAGGCC 
GATATCAGCC GCGCGCATAC CGACTTCGTG GCCAACGCCA GCCACGAACT GCGCACCCCG 
CTCGCCTCGA TCATCGGCTA TATCGAGACG CTGGCCGATC CCGACGCCAA AGTCGACGAA 
GCAACCGCGG CGCGCTTCCA TGCCACGGTG CTGCGCGAGG CACGGCGTCT GCAAAGCCTG 
GTCGAAGATC TCATGTCGCT TTCCCGGATC GAGGCCGAGA AGCACGAGTT GCCGCGCGAT 
CGCATCGATC TCGGCCAGCT TGTCGGCAGC ATCGCCAGCG AAACAGCGAT GACCGTGGGC 
GACGGGCGCC TCGAAGTCGA GACGTGCCCC GCGCTCGTGG CGGGCGACCG GCAGCAGCTT 
GACCAACTCG TGCGCAATCT GATCGACAAC GCGTTCAAGT ATGGAGACAC TGCCGCCCCT 
GTCGCGGTCA AGGTGGCGAT TCACGGCAAC GAAGCGGAGC TGTCGGTGAC CGACAGGGGC 
GAAGGCATCC ACCCCGACCA CCTGCCCTAT CTCACCCGGC GCTTCTATCG GACCGACCCG 
GGACGCAGCC GCGCGGCGGG CGGGACGGGC CTCGGGCTCG CCATCGTGAA GCACATCGTG 
GAGCGGCATC GCGGCAAGCT GGACATCGCC AGCCAGCTTG GAATCGGCAC GACGGTTACC 
GTCAGATTGC CGATTGCAAA CCTGCCCGCT GTTGCTGCAG CCTGA

Protein sequence

MKGLSLPLPS MFVALCAAVV MYFGGAGFWL SLAILLVWLA TLWLARPEPT VETRSRDDGS 
VSRQAMIELV EPFGLPVLML DGQRIAAANA AAREELGSHI VGQDARVALR HPEAVRLLDK 
PEGRALVRGL TGARSIWQVS RVPIDERFSL IEFVNRTAEA DISRAHTDFV ANASHELRTP 
LASIIGYIET LADPDAKVDE ATAARFHATV LREARRLQSL VEDLMSLSRI EAEKHELPRD 
RIDLGQLVGS IASETAMTVG DGRLEVETCP ALVAGDRQQL DQLVRNLIDN AFKYGDTAAP 
VAVKVAIHGN EAELSVTDRG EGIHPDHLPY LTRRFYRTDP GRSRAAGGTG LGLAIVKHIV 
ERHRGKLDIA SQLGIGTTVT VRLPIANLPA VAAA