Gene BBta_4972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4972
Symbol
ID	5156000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5209480
End bp	5210592
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	61%
IMG OID	640559758
Product	putative arylsulfatase regulatory protein
Protein accession	YP_001240887
Protein GI	148256302
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCGA CGGCGTTTTG CAACGTCGAT TGCGACTATT GCTACCTTCC TAACCGAACC 
GACCCGCGGA TCATGAGCCA CGATATCGTC GCTGCGGCGG CAGATTTCGT GTTCCAGGGA 
GGGCTGGACG CGAGCGATTT CACCGTAGTG TGGCATGCCG GCGAACCCTT GGTCGTTCCA 
CCGTCGTGGT ATCGTGAAGC GTTTGCGAGG ATTGGAGCGG CGGCACCGGC GAACAAGGCC 
GTTCCTCATG CCATCCAGAC GAATGGGATG CTGATCAATG ACGATTGGTG CGACCTGTTT 
CTCGCGCACG GCGTTCGAGT CGGTGTCAGC ATCGATGGTC CTGCGTTCTT GCACGATGCA 
CGTCGCCGCA CCCGCTCCGG TAAGGGGACA CATGCTGCGG CGCTGCGTGG GCTGCGGAAG 
CTCAGGGAGC GCGGCGTGCC AAGCCACGCT ATCTGCGTCG TCACCAATGC AACCTTGCCG 
CATGCGCGCG AACTCATTGC TTTCTTCAAT GAAGAAGGCG TCACGGATCT GGGCTTCAAT 
ATCGAGGAAG TGGAAGGCGC CAACACGGCG TCAAGCCTGG CACGCCCCGG CTCGATCGAG 
GATTTTCGGG CGTTTTTCGA AGGCGTGCTG GAAGCTGCCG ACAGCGCGAG TCCGCCGCTG 
CGCATCCGCG AGTACCGAAA CATGCTTGCA ATGCTCAAGC ACCCGGCCTT TGGCCGCTTG 
AACGCCAATT CCCAGAACAT GCCCTTCGCC ATGCTGACTG TCGCGACCGG CGGTGAGCTT 
TTCACCTTCT CGCCGGAATT GGCCGGCTTG CTGCATCAGG ACTACGGCAA CTATGTTGTG 
GGCCGGTTGC CGCAAGCGCG TCTGGGTGAC GTGCTCGCCA ATCCGGTATT TCGCCGCATG 
CTCGACGACA TCTGGGAGGG GATCGCGCTG TGCCATCAGA GCTGCCGATA TTTCGACATT 
TGCCTCGGTG GGTCGCCCGT CAACAAGATG TCGGAGTGCG GGAGCTTCGT GGCTACGGAA 
ACCCTTGCCT GCAAGCTGGT CCATCAGGTC GTCGCCGACG TATCGCTCGC CCATCTGGAT 
CGGCGGATGT CGGACGAGCG TATTGGGGCC TGA

Protein sequence

MQPTAFCNVD CDYCYLPNRT DPRIMSHDIV AAAADFVFQG GLDASDFTVV WHAGEPLVVP 
PSWYREAFAR IGAAAPANKA VPHAIQTNGM LINDDWCDLF LAHGVRVGVS IDGPAFLHDA 
RRRTRSGKGT HAAALRGLRK LRERGVPSHA ICVVTNATLP HARELIAFFN EEGVTDLGFN 
IEEVEGANTA SSLARPGSIE DFRAFFEGVL EAADSASPPL RIREYRNMLA MLKHPAFGRL 
NANSQNMPFA MLTVATGGEL FTFSPELAGL LHQDYGNYVV GRLPQARLGD VLANPVFRRM 
LDDIWEGIAL CHQSCRYFDI CLGGSPVNKM SECGSFVATE TLACKLVHQV VADVSLAHLD 
RRMSDERIGA