Gene Cag_1250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1250
Symbol
ID	3748288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1713589
End bp	1714947
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	48%
IMG OID	637773788
Product	nitrogenase iron-molybdenum cofactor biosynthesis protein NifN, putative
Protein accession	YP_379554
Protein GI	78189216
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.113259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACATG AACATGCAAA ATCCGTTACG CAAAACGCTT GTAAGCTTTG CAACCCACTT 
GGTGCCTGCC TTGCATTCCG TGGCATTGAG CAGTGTGTGC CATTTTTACA CGGTTCGCAA 
GGGTGCGCCA CCTACATTCG TCGCTATTTA ATTAGCCACT ATAAAGAGCC AATTGATATT 
GCTTCATCAA ACTTTAACGA AGAAACAGCG GTCTTTGGTG GCAGCCACAA CTTAAAGGTG 
GGCTTAAAAA ACGTAAGCCA GCAATACAAG CCGCAAGTAA TTGGCATTGC TACAACCTGC 
TTAAGTGAAA CCATTGGCGA CGATGTACCA CGCATTTTAC GTGAGTACCA AAAAGAGTTT 
AAAAACGGCA CACCAATGCC GCTTTTGATT CACGCATCAA CGCCAAGCTA CCAAGGGAGC 
CACATTGATG GATTTCATGC AGCCGTTCAT GCAGCCATTA AAACGCTTGC AACCAAAGGG 
CAAAAGCAAG AGCAGATCAA CCTCTTTCCC AACATGGTCT CGCCCGCTGA TTTGCGCCAC 
CTGAAAGAGA TTTTTGCGGA CTTTGAGATT CCGCTCATGA TGTTGCCCGA CTATTCGCAA 
ACTATGGATG GCGGACCGTG GGCAGAGTAC CACCGCATTC CACCGGGAGG CACGCCAGCA 
ACGGCTATTG CTGATTCTGC AAATAGCCGT GCAAGCATTG AATTTGGCTC CACTATTGAA 
GCAAACAAAT CAGCAGCACA CTATCTTGAT GTCATGTTTG GTATTCCAGC GTATCGCATG 
GCGCTCCCAA TTGGCATTAA AGCAAGCGAT CGCTTTTTCA GCCTGCTTGA AACCTTGAGC 
GAAAAAGGGC GCCCTGAAAA GTATGACGAT GAACGTCGCC GCTTAGTAGA TGCCTATGCT 
GACGGACACA AATATGTTTT TGAAAAAAAG GTGATTCTCT ACGGCGAAGA AGACCTTGTA 
GTTGCCATAA CCGCCTTTTT ACGCGAAATA GGCATGATTC CCGTGCTTTG CGCCTCAGGC 
GGAAAGAGCG GCATGTTAAA GGAGCGCATT GCAGAAATTG TGCCCGATAT GGAAGAGCTT 
GGCATTAAAG TGCGCGATGG CGTTGACTTT GTTGATATCG AAGATGAAGC TAAAGTGCTA 
CACCCCGATT TACTCATGGG CAACAGCAAA GGCTTTACCA TGTCGCGTAA AAATGAGATT 
CCGCTCTTAC GCCTTGGCTT CCCAATCCAC GACCGCTTTG GCGGGCAGCG TATGCACCAC 
CTTGGCTACC GCGGCACCCT TGAATTGTTC GACCGCATTG TCAACATGAT TATTGAAACA 
CGTCAGAACG CATCACCAAT TGGCTACACT TATATGTAA

Protein sequence

MKHEHAKSVT QNACKLCNPL GACLAFRGIE QCVPFLHGSQ GCATYIRRYL ISHYKEPIDI 
ASSNFNEETA VFGGSHNLKV GLKNVSQQYK PQVIGIATTC LSETIGDDVP RILREYQKEF 
KNGTPMPLLI HASTPSYQGS HIDGFHAAVH AAIKTLATKG QKQEQINLFP NMVSPADLRH 
LKEIFADFEI PLMMLPDYSQ TMDGGPWAEY HRIPPGGTPA TAIADSANSR ASIEFGSTIE 
ANKSAAHYLD VMFGIPAYRM ALPIGIKASD RFFSLLETLS EKGRPEKYDD ERRRLVDAYA 
DGHKYVFEKK VILYGEEDLV VAITAFLREI GMIPVLCASG GKSGMLKERI AEIVPDMEEL 
GIKVRDGVDF VDIEDEAKVL HPDLLMGNSK GFTMSRKNEI PLLRLGFPIH DRFGGQRMHH 
LGYRGTLELF DRIVNMIIET RQNASPIGYT YM