Gene Gdia_3032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3032
Symbol
ID	6976466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3319456
End bp	3320859
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	72%
IMG OID	643392540
Product	carbamoyl phosphate synthase small subunit
Protein accession	YP_002277377
Protein GI	209545148
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.11486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0418192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATAT CGATCGAGAC CATCATCGAG CGTCTGGGCG GCGCGGATCA TGCCGCCCGG 
CTGACCGGCG TCGGGACCGA GGCCATCCGC AAATGGCGGC AGGCCCGCGC GATCCCGCCC 
AAGCATTGGA CGGTCATCCT GCGCCACACC GGCCTCAGCC TTTCCGACCT GCAACCCGAC 
AGCGCGTCCG ACCGAGCGGA GACCCAGATG CCGGAGACCC CGTTACCCCC CGCCACCCAG 
CCCCCCGAAG GCGCCACCGC CGCGCTGGTC CTGGCCGACG GCACGGTCGC GTGGGGGCGC 
GGCTTCGGCG CGCATACGCC GGCCGCCGGC AGCGCCATCG GCGAACTGTG CTTTTCCACC 
GGCATGACCG GCTATCAGGA AACCCTGACC GATCCCTCCT TCGCCGGGCA GATCATCACC 
TTCACCTTTC CCCATATCGG CAATGTCGGC ACCAACGCGG ATGACGACGA AGCCCCCCGC 
GTGGCCGCGC GCGGGCTGGC GGTCAAGCAG GACCTGACCG AGCCCGCCAA CTGGCGCGCG 
ACGCAGGGGC TGGACGCCTG GCTGGCCGGC CAGGGCGTGC CGGGCATCTG CGGCGTCGAT 
ACCCGCGCCA TCACGCTGCG GGTGCGCGAC GGCGGCCCGC AGACCGCCAT CCTGGCCTAC 
CCCGCCGACG GCGTGTTCGA CCTGGACGCC CTGCGTGCCC AGGCCGCCGC ATGGCCGGGG 
CTGGAAGGCA TGGACCTGGC CCGCGACGTG ACCTGCGCCG CCCCCTATTC CTGGGACAAG 
GGCGTCTGGA CCTGGCCCGC GGGCACCTGC CCGCTGCCCG AGCGCCGCCG CCGCGTGGTC 
GCGGTCGATT ACGGCGCCAA GCGCAACATC CTGCGCTGCC TGGCCAGCGC GGGCTGCGAC 
GTGACGGTCG TGCCGGCCAC GGCCACGGCG GACCAGATCC TGGCCCACGC GCCGGACGGC 
GTGTTCCTGT CCAACGGCCC GGGCGACCCG GCCGCGACCG CCGAATATGC CGTGCCGGCG 
ATCCGCGGCG TGCTGGAGGC CGGCAAGCCG GTCTTCGGCA TCTGCCTGGG CCACCAGTTG 
CTGGCGCAGG CGCTGGGCGC GCGCACCTAC AAGCTGGCGC GCGGCCATCG CGGCGCCAAC 
CAGCCGGTCA AGGACCTGGG AACCGGGCGG GTCGAGATCA CGAGCCAGAA TCACGGCTTC 
GCGGTGGACG AATCCAGCCT GCCCGCCGAC GTGCGCGTGA CCCATACCAG CCTGTTCGAC 
GGCTCGAACG AGGGCATCGC CTCCGACCGC TATCCGGCCT TCTCGGTCCA GTACCATCCC 
GAGGCCAGCC CCGGCCCGTC GGACAGCCAT TATCTGTTCG ACCGCTTCGT CGCCCTGATC 
GACCGCGTCA ACGCACCCGT CTGA

Protein sequence

MPISIETIIE RLGGADHAAR LTGVGTEAIR KWRQARAIPP KHWTVILRHT GLSLSDLQPD 
SASDRAETQM PETPLPPATQ PPEGATAALV LADGTVAWGR GFGAHTPAAG SAIGELCFST 
GMTGYQETLT DPSFAGQIIT FTFPHIGNVG TNADDDEAPR VAARGLAVKQ DLTEPANWRA 
TQGLDAWLAG QGVPGICGVD TRAITLRVRD GGPQTAILAY PADGVFDLDA LRAQAAAWPG 
LEGMDLARDV TCAAPYSWDK GVWTWPAGTC PLPERRRRVV AVDYGAKRNI LRCLASAGCD 
VTVVPATATA DQILAHAPDG VFLSNGPGDP AATAEYAVPA IRGVLEAGKP VFGICLGHQL 
LAQALGARTY KLARGHRGAN QPVKDLGTGR VEITSQNHGF AVDESSLPAD VRVTHTSLFD 
GSNEGIASDR YPAFSVQYHP EASPGPSDSH YLFDRFVALI DRVNAPV