Gene Bind_3531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3531
Symbol
ID	6200613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	4012003
End bp	4013268
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	60%
IMG OID	641707487
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_001834577
Protein GI	182680431
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.56559
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATTTCT GGATCGAGCC CTTTAAACCC GATTTCAAGG CGCGCATGAC GCAGGATTTG 
CCAAGCTCTC CCCTCCCACT GCGGACAGAT GAAGCCAAAG GCTGGAGCAA GCCGGTCGCG 
ACCGCCGTTT TGGTGCTCGC CGACGGCACC GTCCTGCGAG GCTCGGGCTT CGGCGCCATC 
GGCGAGGCCG TCGCCGAAGT CTGCTTCAAC ACCGCGATGA CCGGTTATCA GGAAATCCTG 
ACCGACCCGT CCTATGCTGA ACAGATCGTC ACCTTCACCT TTCCGCATAT CGGCAATGTC 
GGGACCAACG AAGACGATTT CGAAACGACC AATTTCGAGG CGCAAGCGAG CGTGCGCGGG 
CTGATCGTTC TCGCACCCAT CACCAATCCT TCGAATCATC GCTCGACGAG CCATTTCGAC 
GCCTGGCTGA AATCACGCTC GATCATCGGC CTTTCCGGCA TCGATACACG CGCCCTAACG 
ACGCTGATCC GCGAAAAAGG CATGCCCAAT GCCGTCATCG CCCATCATCC GGATGGGATT 
TTCGACATCG AGGCCCTGAA AGCCAAGGCT GCGGCCTGGC ACGGCATAGA CGGAATGGAT 
CTTGTTCCGC CCGTCACAAG CAGCAAGCCG CATGAATGGA CGGCAACCGG CATCCTTCCC 
GCCCGTGCCT TGCAGCCCAA CAATGGCGAG AACAGGCATC GTGTTGTCGC CATTGATTAT 
GGCGTCAAGC GCTCGATCCT GCAGCTCTTG ACCGAGGCGG GCTGCGCGGT CACCGTCGTC 
CCGGCCACCG CATCAGCGCA AGAGATCGCC GCCCTGGAGC CGGACGGCAT TTTCCTGTCC 
AATGGCCCTG GCGATCCCGC CGAAACCGCC AAATATGCGG TGCCGATCAT TCAGGATCTT 
CTGGAGCGTA AAATCCCGAC CTTCGGCATT TGCCTCGGCC ATCAGATCCT GGCCCTGGCG 
ATTGGCGCCA AAACGCACAA AATGCGGCAA GGCCATCACG GCGCCAATCA TCCGGTCCTC 
GACAAGACCA CTGGAAAGGT CGAGATCGTG TCGATGAACC ATGGCTTCGC TGTCGATATC 
GAAACCTTGC CGCCACAAGC AGTCGAGACG CATCTCTCTC TTTTCGACGG CACCAATTGC 
GGCATTGCGC TCACCGACCG TCCTGCCTTT TCGGTGCAGC ACCATCCTGA GGCCTCACCC 
GGCCCGCGCG ACAGTCATTA TCTCTTCCAG CGTTTCGTCA CGCTGATGGA ACAGGCGAAG 
GCCTGA

Protein sequence

MDFWIEPFKP DFKARMTQDL PSSPLPLRTD EAKGWSKPVA TAVLVLADGT VLRGSGFGAI 
GEAVAEVCFN TAMTGYQEIL TDPSYAEQIV TFTFPHIGNV GTNEDDFETT NFEAQASVRG 
LIVLAPITNP SNHRSTSHFD AWLKSRSIIG LSGIDTRALT TLIREKGMPN AVIAHHPDGI 
FDIEALKAKA AAWHGIDGMD LVPPVTSSKP HEWTATGILP ARALQPNNGE NRHRVVAIDY 
GVKRSILQLL TEAGCAVTVV PATASAQEIA ALEPDGIFLS NGPGDPAETA KYAVPIIQDL 
LERKIPTFGI CLGHQILALA IGAKTHKMRQ GHHGANHPVL DKTTGKVEIV SMNHGFAVDI 
ETLPPQAVET HLSLFDGTNC GIALTDRPAF SVQHHPEASP GPRDSHYLFQ RFVTLMEQAK 
A