Gene Cag_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_2003
Symbol
ID	3747113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2539273
End bp	2540406
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	41%
IMG OID	637774540
Product	fic family protein
Protein accession	YP_380294
Protein GI	78189956
COG category	[S] Function unknown
COG ID	[COG3177] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0278833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTG AAGAGTTTAC TGCGGGATAT TGGCAGCAGC GGTATCAATA CAAAAGTTTT 
GAACCCTCCC TCATTAACCA TGAATGGACT TGGGACGAGC CAACCATTAA CACCCTGTTA 
GAGCAGGCAA ATTGTGCACT TGGTGAGCTT AACGCCTTCT CATTGATTGT GCCAAATATT 
GACCTTTTTA TTCAAATGCA CGTTGTTAAA GAGGCTCAAA CATCAAGCAA AATTGAAGGT 
ACGCAAACTG GCATTGATGA GGCATTGTTG TCGGAGGAAC AAATCAGCCC TGAAAAGCGA 
GATGATTGGC GAGAGGTGCG TAACTATATT GACGCCGTTA ACAGTGCCAT TACAACATTG 
CACGACTTAC CGCTTTCAAA TCGCCTTTTA AAACAAACAC ACAAAATTTT ACTCAGTGGT 
GTTCGTGGCG AGCATAAGCT GCCGGGTGAA TTTCGTGTCA GTCAAAACTG GATTGGTGGC 
TCTAATTTAA CCGATGCAAG TTTTATTCCT CCGCATCCAG AAAGCGTGGC GGAGTTAATG 
AGCGATTTAG AAAAGTTCTG GCATAATCAG GACATTGCAG TACCTCATCT TATTCGCATT 
GCGTTAAGCC ATTATCAGTT TGAAACCATC CATCCTTTTC TTGATGGTAA TGGACGCATT 
GGCAGATTAT TAATTCCACT TTATTTAGTA AGTCATGGAG TACTTGCAAA ACCGTCGCTC 
TATCTTTCCG ACTTTTTTGA ACGTCATCGT TCAAGTTATT ACGATGCCTT AATGCACGTT 
CGCACCAGCA ATAACCTTAT TCATTGGTTG AAATTTTTCT TAAACGGAGT TGCACAAACA 
GCAACAAAGG GAAGAGATAT TTTTCAGCAA ATTTTAACGC TTAGAGAGGA AGTTGAACAA 
GCAGTTTTAA GTTTAGGAAA GCGAGCAACA CTTGCGCGTG AAGCGTTGCA TCTGCTGTAT 
CGCCAACCAA TTGTAGAGGC AACTGACTTT TCTACTATGC TTAAAGTGAG TGCTCCAACA 
GCAAATGCAC TTATTCAAGC CTTGATTGAT AAAGCTATTC TTGTGGAAAT TACAGGGCAG 
CAACGAGGGC GAATTTATTC ATTCGAGCGC TACGTAAAGT TGTTTATGGA GTAG

Protein sequence

MKFEEFTAGY WQQRYQYKSF EPSLINHEWT WDEPTINTLL EQANCALGEL NAFSLIVPNI 
DLFIQMHVVK EAQTSSKIEG TQTGIDEALL SEEQISPEKR DDWREVRNYI DAVNSAITTL 
HDLPLSNRLL KQTHKILLSG VRGEHKLPGE FRVSQNWIGG SNLTDASFIP PHPESVAELM 
SDLEKFWHNQ DIAVPHLIRI ALSHYQFETI HPFLDGNGRI GRLLIPLYLV SHGVLAKPSL 
YLSDFFERHR SSYYDALMHV RTSNNLIHWL KFFLNGVAQT ATKGRDIFQQ ILTLREEVEQ 
AVLSLGKRAT LAREALHLLY RQPIVEATDF STMLKVSAPT ANALIQALID KAILVEITGQ 
QRGRIYSFER YVKLFME