Gene Ajs_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ajs_0035
Symbol
ID	4672168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax sp. JS42
Kingdom	Bacteria
Replicon accession	NC_008782
Strand	-
Start bp	36284
End bp	37504
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	72%
IMG OID	639837168
Product	sulfite dehydrogenase (cytochrome) subunit SorA apoprotein
Protein accession	YP_984367
Protein GI	121592471
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.7902
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.133868
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACACCC AAGCTCCCGC CTCCCTGCCC CGCCGCCGCC TGCTGGCGGG CAGCGCCAGC 
GCGCTGGCCG CCGCCGGCCT GGCCAGCTTC CACCAGGGCG CCGCGGCGCA GTCGGCCGCG 
CCGGCCGCGG CCAAGCCGCT GCCCGGCTAC GCCGGCTGGA AGAACGCCGA TGCCGTCATC 
GTGCACAGCA GCACCACCAT CGAGACGCGC CGCGGCGCCT TTGGCACCAG CGTCATCACG 
CCCTCGGACC AGCTGTACGT GCGCAACAAC CTGCCCACGC CGCCCGAGTC CATCGTCGCT 
GACCGCGACG CCTGGCAGGT GCAGGTGAGC GGGGTAAAGG AGCCGCGCCG CCTGTCGGTG 
CGCGAGCTCA AGGCCATGGG GCTGGAGACG GTGACCATGG TGCTGCAGTG CTCGGGCAAC 
GGCCGGGGCT TCTTCCCCAG CAAGCCCAGC GGCACGCCCT GGACGGTGGG CGCCGCCGGC 
TGCGTGGTCT GGAGCGGCGT GCCCGTGCGC GACGTGGCGC GCGCCCTGGG TGGCGTGGCT 
GACGGCATGA AGTACATGAC CGGCACCGGC GGCGAGGTGC TGCCCGCCGG CATCGACCCC 
AAGACGGTGA TCGTCGAGCG TTCGGTGCCG CTGGAGGCCA TGCAGGATGC GCTGCTGGCC 
TGGGAGATGA ACGGTGAGCC CATACCGCTG GCGCACGGCG GGCCGCTGCG CCTGATCGTG 
CCGGGCTACA CCGGCGTGAA CAACATCAAG TACATCGGCC AGCTCGCCTT CACCGACAAG 
GAGAGCGAGG CGCGCATCAT GAGCCACGGC TACCGCATCT CGCCGCCGGG CGGCAAGGGC 
GACCCCAGCC AGCCGTCGGT GCAGCAGATG AGCGTCAAGT CCTGGATCAA CGGCCCGCTG 
CCCGAAGATG GCGAGCTGGC CCCGGGCCGC GTGCAGATCC ACGGCGTGGC CTTCGGCGGC 
ATGCACGCCG TCAAGGGTGT GGAGGTGTCC GTCGATGGCG GCAAGACCTG GCAGGCCGCG 
CGCCTGGTGG GCCCGGACAT GGGCCGCTAC GCCTGGCGCC AGTTCGTGCT GCAGGCCGAC 
CTGCCGCGCG GCAGCCACAC CCTGGCCAGC CGAGCCACCG ATGCTCAGGG CAACGTGCAG 
CCCGAGCAGC GCGAGGAGAA CCAAGCCGGC TACAACAACA GCAGCTGGGC GGACCACGCG 
GTGACCGTCA AGGTGGCCTG A

Protein sequence

MHTQAPASLP RRRLLAGSAS ALAAAGLASF HQGAAAQSAA PAAAKPLPGY AGWKNADAVI 
VHSSTTIETR RGAFGTSVIT PSDQLYVRNN LPTPPESIVA DRDAWQVQVS GVKEPRRLSV 
RELKAMGLET VTMVLQCSGN GRGFFPSKPS GTPWTVGAAG CVVWSGVPVR DVARALGGVA 
DGMKYMTGTG GEVLPAGIDP KTVIVERSVP LEAMQDALLA WEMNGEPIPL AHGGPLRLIV 
PGYTGVNNIK YIGQLAFTDK ESEARIMSHG YRISPPGGKG DPSQPSVQQM SVKSWINGPL 
PEDGELAPGR VQIHGVAFGG MHAVKGVEVS VDGGKTWQAA RLVGPDMGRY AWRQFVLQAD 
LPRGSHTLAS RATDAQGNVQ PEQREENQAG YNNSSWADHA VTVKVA