Gene Aave_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aave_1997
Symbol
ID	4667244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax citrulli AAC00-1
Kingdom	Bacteria
Replicon accession	NC_008752
Strand	-
Start bp	2169435
End bp	2170517
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID	639823208
Product	protein of unknown function DUF513, hemX
Protein accession	YP_970355
Protein GI	120610677
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.178831
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00087964
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTTCCG AGCCCACCCA CGCACCTTCC GCGCCTCCCG CAGGCCCGGC GCCCCAGGCC 
TCCGGCGTGC AGCGCGCCGT GCTGACGCTG CTCGGCGTCG TGGCCGTCGC AGGCCTCGCG 
ACCAGCGTCA TGCTGTGGCA GCGCCTCGGC AGCATCCAGG AACAGCTCGC GCGCCAGTCG 
GCCGATGCCG GCGCGCAGTC CATCGAGGCC CGCACCCTCG CCAACCAGGC GCTGGACATG 
GCGCGCGACG TCTCGGCGCG CATCGCCGTG AACGAAACCC GCGTGAGCGA AGTCGCCCTG 
CAACGCAGCC AGCTCGAGGA ACTCATGCAG AGCCTCTCGC GCTCGCGCGA CGAGAACCTG 
GTGGTGGACA TCGAATCCGC GCTGCGCCTC GCGCAGCAGC AGGCCCAGCT CACCGGCAGC 
CTGGAGCCCG TCATGGCCGC GCTCAAGAGC GCCAGCCAGC GCATCGAGCG GGCCGCGCAG 
CCGCGCCTGG CCCCCGTGGC GCGCGCCATC GGCCGCGACC TCGACCGCGT GGGCTCGGCG 
CAGGTCACCG ACACGGCCGG CCTGCTGGCC CGCCTGGACG ACCTCATGCG CCAGGTGGAC 
GAACTGCCCC TGCAGAACGC CGTGGCCCAG GCCGCGGCCA CGCGGCGCAT GAATGCCGCC 
GCCCGCCCGT CCGAGGGCCC GGCCGCGCCC GGAGCCGACG GCGCCCTGCC CTGGTGGCAA 
GCCGCGCTGC AGCGCGGCTG GGAAGTCGTG CGCGACGAGG CCCGCCAGCT GCTGCGCGTC 
ACCCGCATCG ACCGCCCGGA AGCCATCCTC ATCGCCCCCG ATCAGGCCTT CTTCCTGCGC 
GAGAACCTCA AGCTCCAGCT GATGAACGCC CGCCTCGCGC TGCTGGCGCG CCAGTACGAA 
TCGGCGCGCG CAGACCTCTC CGCCGCCAAC AACGCCCTGG GCCGGTACTT CGATCCCGCA 
TCGCGCCGCA CGCAGACAGC GGCCACGGTG CTGCAGCAGG CGCAGGTCCA CCTCAAGGGC 
GCCGCCCTGC CCACGCTGGA CGAAACCTTC GCCGCGCTGG CCACCGCCGC CGCCGGCCGC 
TGA

Protein sequence

MSSEPTHAPS APPAGPAPQA SGVQRAVLTL LGVVAVAGLA TSVMLWQRLG SIQEQLARQS 
ADAGAQSIEA RTLANQALDM ARDVSARIAV NETRVSEVAL QRSQLEELMQ SLSRSRDENL 
VVDIESALRL AQQQAQLTGS LEPVMAALKS ASQRIERAAQ PRLAPVARAI GRDLDRVGSA 
QVTDTAGLLA RLDDLMRQVD ELPLQNAVAQ AAATRRMNAA ARPSEGPAAP GADGALPWWQ 
AALQRGWEVV RDEARQLLRV TRIDRPEAIL IAPDQAFFLR ENLKLQLMNA RLALLARQYE 
SARADLSAAN NALGRYFDPA SRRTQTAATV LQQAQVHLKG AALPTLDETF AALATAAAGR