Gene Avin_11540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_11540
Symbol
ID	7760096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1104157
End bp	1105377
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	74%
IMG OID	643804056
Product	exonuclease subunit SbcD
Protein accession	YP_002798358
Protein GI	226943285
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.341615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTCC TGCACACCTC CGACTGGCAC CTCGGCCAGC ACTTCATGGG CAAGACCCGC 
CAGGCCGAGC ACCGGGCCTT CTGCGACTGG CTCGTCGAGC GGGTGCGCGA GCACGCGGTC 
GACGCGCTGA TCGTCGCCGG CGACCTGTTC GACAGCGGCG CGCCGCCCAG TCATGCCCGC 
GAGCAGTACA ACCGCTTCAT CGTCGCGCTG CGCGCGACCG GCGCCCGCCT GGTGGTGCTC 
GGTGGCAACC ACGATTCGGT GGCCATGCTC GGCGAGTCGC GCGGTCTTCT GGCCTGCCTG 
GACACCTGGG TGATTCCGGG CGTGGCGGCG GACCCGGCCG AGCAGCTCCT GCTGTTGCCG 
CGGCGCGACG GTGCGCCGGG CGCGTTGCTC TGCGCCATCC CCTTCATCCG TCCGCGCGAC 
GTGCTGAAAA GCGAGGCCGG GCAGAGCGCG GACGCCAAGC TGCAGGCGCT GCAGGCGGCG 
ATCCGCGAAC ACTACCGGGC GCTGTTCGCC CTCGCCGAGG CGCGTCGCCG CGAGCTGGGC 
GGCGCCCTGC CGATCGTCGC CACGGGGCAC CTGACCACCG TCGGCGCCAG TGCCAGCGAA 
TCGGTGCGGG AGATCTACGT CGGCAGCCTG GAGGCTTTCC CGACCGATGC CTTCCCGCCG 
GCGGCCTATG TCGCCCTCGG CCATATCCAT CGCCCGCAGC AGGTCGCCGG GCTGGAGCAC 
ATCCGCTACA GCGGCTCGCC GATCCCGCTG TCCTTCGACG AGGCGCGCCA GTGCAAGGAG 
GTGTTGCTGG TCGACCTGGG CGAGGACGGC CTCGAGGCGG TGACGCCGCT GCCAGTGCCC 
TGTTTCCAGC CGCTGCTCAC GCTGCGCGGC GATCTCGCCG AGCTGGCCGG CGCCGTTGTC 
GAGGCGGCCG CCGGGGGTAG CGCCGAGCGT CCGGTGTGGC TGGAGGTCCG GGTCGTCGCC 
GACGAGCACC TGCCCGACCT GCCGGCGCGC GTCGCCGCCC TTTGCGCGGG GCTGCCGGTG 
GAGGTGCTGC GCATCCGCCG CGAGCGCGGC GACGCAGTCG CCCGCCTGTG CCGCGAGGCA 
CGGGAAACCC TCGACGAACT GAGCCCCGAG GAGGTGTTCG AACAGCGCCT GGCCGGCGCG 
GCACTGGACG AGGCGCTGGC CGGGCGCCTG CGCGGCCTGC ACCGCCAGGT GCTCGACGAG 
CTGCGCGAGG AGCGGGCGTG A

Protein sequence

MRLLHTSDWH LGQHFMGKTR QAEHRAFCDW LVERVREHAV DALIVAGDLF DSGAPPSHAR 
EQYNRFIVAL RATGARLVVL GGNHDSVAML GESRGLLACL DTWVIPGVAA DPAEQLLLLP 
RRDGAPGALL CAIPFIRPRD VLKSEAGQSA DAKLQALQAA IREHYRALFA LAEARRRELG 
GALPIVATGH LTTVGASASE SVREIYVGSL EAFPTDAFPP AAYVALGHIH RPQQVAGLEH 
IRYSGSPIPL SFDEARQCKE VLLVDLGEDG LEAVTPLPVP CFQPLLTLRG DLAELAGAVV 
EAAAGGSAER PVWLEVRVVA DEHLPDLPAR VAALCAGLPV EVLRIRRERG DAVARLCREA 
RETLDELSPE EVFEQRLAGA ALDEALAGRL RGLHRQVLDE LREERA