Gene BBta_4022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4022
Symbol
ID	5152472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	4226022
End bp	4227197
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	66%
IMG OID	640558853
Product	putative cysteine synthase
Protein accession	YP_001239994
Protein GI	148255409
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.504798
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGCAGG GATCGTGGTC GGTTGCCGGG ATGATCTCGC CTGCCTCCCG TGCTTCGCAA 
GTCTCGCTGC CTCGCTACCG CCGCGTCTGG GTCGACGATG CCGTGGCCGC GATCGAGGCT 
GATCAGTGCC GGACAGCTGA TACGCATCTG ATCCGCCTCA TCGTGCCGGC GCTGGCGGGC 
ATCGACATTT ACCTGAAGGA CGAATCGACG CATCCGACCG GCAGCCTGAA GCATCGGCTC 
GCCCGCTCGC TATTTCTCTA TGCGCTCTGC AATGGTCATA TTCGCGAAGG CACGCCGGTG 
GTCGAGGCGT CCTCGGGGTC GACCGCGGTG TCGGAGGCCT ATTTCGCGCA GATGATCGGC 
GTGCCGTTCT ATGCAGTGAT GCCGCGCACC ACCTCGCCTG AGAAGATCGC GGCGATCACC 
CATTATGGCG GCAATTGCCA CCTGATCGAT GATGGCCGGG CGCTCTATGC CGAGGCGGCT 
GCGCTCGCGG CGCGGCTCGG TGGTCATTAC ATGGATCAGT TCACCTTCGC CGAGCGCGCC 
ACCGATTGGC GCGGCAACAA CAATATCGCC GAATCGATCT TCAACCAGCT GCAGGGCGAG 
CGCTGTCCAC TGCCGGAATG GATCGTGATG GGCGCCGGCA CCGGCGGCAC GTCGGCGACC 
ATGGGCCGTT ATTTGCGCTA TCGCCGTTAT CCCACGCGGC TCTGCGTCGC CGACGTCGAG 
CATTCCGCCT TTTTCGATGC CTTCTGCTCG GGCGATGTCC GGCAGACCTG CGAGAGGCCG 
TCCCTGATCG AGGGCGTCGG CCGGCCGCGT TGCGAGCCGT CCTTCGTGCC GGGGGTAGTC 
GACCGCATGA TCAAGGTGCC GGACGCGGCC TCGATCGGGG CGATGAGCGT GCTGACAAGG 
CGGCTGCGCC GGCCGGTCGG CGGCTCGACC GGGACCAACT TCCTGGCGCT ATGCCGGCTT 
GCCTCCGAGA TGCGCGAGGC CGGTGTGATC GGATCGGTCG TGACGTTGAT CTGCGACTCT 
GGCGAGCGCT ACCGCCAGAC CTATTACGAT CCGCAATGGC TGGCGGCGCG CGGCCTCGAT 
CCGGCCCCCT ATGACGCGGC GCTGTCCGCT TTTCTCGACA CCGGCGCGCC GCTCCGCCTC 
GCCATTCCCG ACGCCGTCAA TCCGCGAAGT GACTGA

Protein sequence

MRQGSWSVAG MISPASRASQ VSLPRYRRVW VDDAVAAIEA DQCRTADTHL IRLIVPALAG 
IDIYLKDEST HPTGSLKHRL ARSLFLYALC NGHIREGTPV VEASSGSTAV SEAYFAQMIG 
VPFYAVMPRT TSPEKIAAIT HYGGNCHLID DGRALYAEAA ALAARLGGHY MDQFTFAERA 
TDWRGNNNIA ESIFNQLQGE RCPLPEWIVM GAGTGGTSAT MGRYLRYRRY PTRLCVADVE 
HSAFFDAFCS GDVRQTCERP SLIEGVGRPR CEPSFVPGVV DRMIKVPDAA SIGAMSVLTR 
RLRRPVGGST GTNFLALCRL ASEMREAGVI GSVVTLICDS GERYRQTYYD PQWLAARGLD 
PAPYDAALSA FLDTGAPLRL AIPDAVNPRS D